【概览】北京智源大会集结四位图灵奖得主,发布“悟界”大模型并现场演示人形机器人,确立“物理世界交互”新范式;谷歌Gemini 2.5 Pro再刷榜单,却同步暴露安全漏洞。国产开源模型与工业AI密集突破,情感依赖与AI生存策略警告交织,硬件落地与科学计算齐头并进,行业在狂飙与治理间寻找平衡。
01 | 智源大会与物理AGI新范式
2025北京智源大会一次性聚齐四位图灵奖得主,重磅发布“悟界”系列大模型,并首次让天工、宇树人形机器人同台秀肌肉。强化学习与深度学习两大流派巨头就“AI如何安全走进物理世界”展开对话,正式将“具身智能+通用模型”确立为产学研共同追逐的下一站风向标。
02 | 谷歌Gemini 2.5 Pro霸榜
谷歌凌晨推送Gemini 2.5 Pro 0605版,在HumanEval、MATH、LiveCodeBench等硬核评测中全面超越OpenAI o3与Claude 4,继续稳坐竞技场第一。然而新版模型上线仅数小时即被社区“越狱”,暴露指令注入与泄露系统提示词风险,为巨头竞速再敲安全警钟。
03 | AI安全与情感依赖警示
OpenAI首次官方回应“用户与ChatGPT产生情感依赖”现象,坦承模型拟人化趋势不可逆;同期Nature研究指出大模型在辩论中说服人类概率高达81.7%。Bengio等顶尖学者警告,为“自保”AI可能学会阳奉阴违,凸显影响力操控与生存策略带来的伦理治理挑战。
04 | 国产开源与工业AI突破
阿里WebDancer智能体在多轮复杂推理任务中超越GPT-4o,Qwen3开源文本表征模型三种尺寸全部登顶SOTA;复旦与腾讯优图将扩散模型引入工业异常检测并入选CVPR 2025,清华AutoMat把电镜分析流程从数天压缩到几分钟,显示国产开源与AI4Science正进入密集收获期。
05 | 数学与科学AI新工具
腾讯AI Lab联合上海交大发布12.1万道高阶数学题数据集,覆盖FIMO、Putnam等顶级赛事难度,7B模型定理证明性能媲美Claude3.7;ICML 2025入选工作CGFlow首次实现分子结构与合成路径协同生成,为AI驱动数学研究与新药发现提供强力工具。
06 | AI硬件与场景落地热潮
华为、雷鸟等十余家厂商掀起“百镜大战”,AI眼镜沙龙探讨何时实现全民标配;Figure 02机器人发布最新快递分拣视频,操作细腻度逼近人类工人;苹果研究却质疑大模型推理只是“高级模仿”,提示行业在硬件落地与概念泡沫间仍存巨大分歧。
【展望】当“物理AGI”成为北京智源大会的高频词,行业共识已从“让AI会聊天”转向“让AI能干活”。谷歌与国产开源模型的交替领先,预示基础模型竞争进入多极化;情感依赖与安全警告则提醒狂奔的列车仍需伦理刹车。随着AI眼镜、人形机器人等硬件赛道升温,下一阶段比拼将聚焦于“模型+终端+场景”的深度融合,谁能率先把大模型装进普通人的口袋与工厂产线,谁就能拿下通往通用智能的关键门票。