谷歌Gemini Live上线屏幕共享与实时视频交互,伯克利TULIP、腾讯混元-T1、阿里LHM等视觉-语言-动作模型集中发布,标志着多模态理解与生成交互进入可用阶段,为机器人、自动驾驶、3D内容创作打开新空间。
vivo成立机器人LAB,腾讯领投智元机器人,上海张江发布人形机器人“启程”,CVPR 2025 CrayonRobo、SeeGround等模型让机器人“看见”并操作物体;Browser Use、秒哒等平台降低开发门槛,AI Agent进入规模部署期。
海洋“瀚海智语”、金融Fin-R1、烹饪“食神”、体重管理“减单”、地质GeoMap-Bench等场景大模型相继亮相,显示大模型正从通用对话走向专业深度,结合私有化一体机方案加速在医疗、金融、工业落地。
AMD GAIA、英伟达Cosmos-Transfer1、RF-DETR、AlphaFold-Metainference 等开源工具链降低本地推理与训练成本;蚂蚁集团MoE大模型把训练费用砍至1/3,推动中小企业与个人开发者无障碍使用大模型能力。
欧盟《人工智能法案》重塑全球合规框架,英国部长呼吁勿抵制版权变革,Cloudflare“AI迷宫”反击恶意爬虫,中美官方与智库密集对话,显示政策与伦理议题已与技术迭代同步进入关键窗口期。
最新调研显示AI已可替代双人团队工作量,却同时加剧管理层与员工矛盾;Zoho与OpenAI CEO警告多数程序员岗位或被AI取代,STEM博士创业率因知识爆炸下降38%,提示组织与人才体系需同步变革。