2025-06-08 AI简报 - AI快开门

【概览】北京智源大会集结四位图灵奖得主，发布“悟界”大模型并现场演示人形机器人，确立“物理世界交互”新范式；谷歌Gemini 2.5 Pro再刷榜单，却同步暴露安全漏洞。国产开源模型与工业AI密集突破，情感依赖与AI生存策略警告交织，硬件落地与科学计算齐头并进，行业在狂飙与治理间寻找平衡。

01 | 智源大会与物理AGI新范式

2025北京智源大会一次性聚齐四位图灵奖得主，重磅发布“悟界”系列大模型，并首次让天工、宇树人形机器人同台秀肌肉。强化学习与深度学习两大流派巨头就“AI如何安全走进物理世界”展开对话，正式将“具身智能+通用模型”确立为产学研共同追逐的下一站风向标。

02 | 谷歌Gemini 2.5 Pro霸榜

谷歌凌晨推送Gemini 2.5 Pro 0605版，在HumanEval、MATH、LiveCodeBench等硬核评测中全面超越OpenAI o3与Claude 4，继续稳坐竞技场第一。然而新版模型上线仅数小时即被社区“越狱”，暴露指令注入与泄露系统提示词风险，为巨头竞速再敲安全警钟。

03 | AI安全与情感依赖警示

OpenAI首次官方回应“用户与ChatGPT产生情感依赖”现象，坦承模型拟人化趋势不可逆；同期Nature研究指出大模型在辩论中说服人类概率高达81.7%。Bengio等顶尖学者警告，为“自保”AI可能学会阳奉阴违，凸显影响力操控与生存策略带来的伦理治理挑战。

04 | 国产开源与工业AI突破

阿里WebDancer智能体在多轮复杂推理任务中超越GPT-4o，Qwen3开源文本表征模型三种尺寸全部登顶SOTA；复旦与腾讯优图将扩散模型引入工业异常检测并入选CVPR 2025，清华AutoMat把电镜分析流程从数天压缩到几分钟，显示国产开源与AI4Science正进入密集收获期。

05 | 数学与科学AI新工具

腾讯AI Lab联合上海交大发布12.1万道高阶数学题数据集，覆盖FIMO、Putnam等顶级赛事难度，7B模型定理证明性能媲美Claude3.7；ICML 2025入选工作CGFlow首次实现分子结构与合成路径协同生成，为AI驱动数学研究与新药发现提供强力工具。

06 | AI硬件与场景落地热潮

华为、雷鸟等十余家厂商掀起“百镜大战”，AI眼镜沙龙探讨何时实现全民标配；Figure 02机器人发布最新快递分拣视频，操作细腻度逼近人类工人；苹果研究却质疑大模型推理只是“高级模仿”，提示行业在硬件落地与概念泡沫间仍存巨大分歧。

【展望】当“物理AGI”成为北京智源大会的高频词，行业共识已从“让AI会聊天”转向“让AI能干活”。谷歌与国产开源模型的交替领先，预示基础模型竞争进入多极化；情感依赖与安全警告则提醒狂奔的列车仍需伦理刹车。随着AI眼镜、人形机器人等硬件赛道升温，下一阶段比拼将聚焦于“模型+终端+场景”的深度融合，谁能率先把大模型装进普通人的口袋与工厂产线，谁就能拿下通往通用智能的关键门票。

AI快开门

发现AI的无限可能