2025-09-30 AI简报 - AI快开门

【概览】国产大模型阵营在架构层集体提速：DeepSeek一天内连发V3.2-Exp并开源DSA稀疏注意力，华为云、寒武纪同步完成适配，推理成本再降一个量级。谷歌则把视频生成推至“可推理”阶段，Veo 3首次让多模态模型具备链式思维。端侧与机器人场景同步升温，小参数模型、具身智能和超节点基础设施共同把AI推向“低成本、广部署”拐点。

01 | DeepSeek V3.2稀疏注意力突破

DeepSeek 29日凌晨突袭发布V3.2-Exp，同步开源全新DSA稀疏注意力机制，实现KV-cache压缩与长序列线性扩展；华为云、寒武纪在两小时内完成vLLM适配，推理延迟下降35%、成本再降40%。国产大模型首次以“架构+芯片+云”全栈开源方式对冲全球闭源体系，标志参数竞赛时代终结，系统级协同优化成为新赛点。

02 | 谷歌Veo 3视觉生成迎“GPT-3时刻”

谷歌发布第三代视频模型Veo 3，首次引入“帧链”思维链机制，可实时生成UI、自动解迷宫并玩数独，多模态生成从“看得像”迈入“想得通”。官方将其比作视觉领域的GPT-3，意味着视频模型开始具备显式推理与交互能力，将加速自动驾驶、机器人与实时交互媒体落地。

03 | 具身智能与机器人感知升级

上交-剑桥联合提出注入几何先验的VLA框架，机器人操作成功率提升31%；智源开源零样本跨本体模型RoboBrain-X0，一次训练即可控制不同形态机械臂。Meta推出“安卓式”机器人平台，强调大模型+数据范式，让硬件、算法与数据层解耦，具身智能正走出实验室，向工业柔性产线与家庭服务场景渗透。

04 | 国产小模型逆袭与高效训练

北大-360联合推出的32B TinyR1在安全评测中碾压千亿级模型；陈丹琦团队8B RLMT用新型强化学习策略在推理任务上超越GPT-4o；LiquidAI Nanos系列把10B参数压缩至边缘可运行规模。算法层面的稀疏化、强化学习与知识注入验证了“小即美”路线，显著降低算力门槛，为私有化部署和边缘AI打开商业空间。

05 | AI基础设施与算力成本革命

浪潮信息基于DSA稀疏内核实现8.9 ms单请求推理、1元/百万token行业最低价；华为CloudMatrix384超节点上线即支持DeepSeek V3.2，展示国产硬件弹性。FlashAttention作者断言GPU垄断将在三年内被打破，软硬件协同优化正把大模型推理推向“白菜价”，为Agent大规模商用扫清成本障碍。

06 | OpenAI模型暗箱与信任危机

多名付费用户实测证实OpenAI在未告知情况下降级模型并植入安全模型过滤内容，引发“GPT门”集体投诉；马斯克第六次起诉OpenAI窃取商业机密。事件凸显闭源模型在透明度、可控性与商业伦理上的系统性风险，或进一步推高企业与政府市场对开源方案的需求。

07 | 中国模型屠榜与开源生态领先

阿里通义七款模型同时登顶Hugging Face，Qwen3-Omni拿下全球第一；蚂蚁百灵开源Ring-flash-2.0思考模型，阿里云发布Qwen3Guard安全护栏。国产模型在开源社区形成“群狼”效应，吸引大量海外开发者迁移，为中文数据与东方场景标准输出奠定基础。

【展望】当“稀疏注意力+超节点”把推理成本压到极限，当视频模型具备链式思维，当小参数模型在边缘端超越巨兽，AI产业正式从“堆算力”转向“拼效率”。开源与闭源的信任鸿沟同步放大，预计更多企业与政府客户将优先选择可验证、可落地的国产开源方案；硬件、模型、数据三轮驱动下，Agent与具身智能的规模化商用或在未来两个季度进入爆发期。

AI快开门

发现AI的无限可能

AI行业新闻简报 2025.09.30 周二