【概览】国产大模型阵营在架构层集体提速:DeepSeek一天内连发V3.2-Exp并开源DSA稀疏注意力,华为云、寒武纪同步完成适配,推理成本再降一个量级。谷歌则把视频生成推至“可推理”阶段,Veo 3首次让多模态模型具备链式思维。端侧与机器人场景同步升温,小参数模型、具身智能和超节点基础设施共同把AI推向“低成本、广部署”拐点。
01 | DeepSeek V3.2稀疏注意力突破
DeepSeek 29日凌晨突袭发布V3.2-Exp,同步开源全新DSA稀疏注意力机制,实现KV-cache压缩与长序列线性扩展;华为云、寒武纪在两小时内完成vLLM适配,推理延迟下降35%、成本再降40%。国产大模型首次以“架构+芯片+云”全栈开源方式对冲全球闭源体系,标志参数竞赛时代终结,系统级协同优化成为新赛点。
02 | 谷歌Veo 3视觉生成迎“GPT-3时刻”
谷歌发布第三代视频模型Veo 3,首次引入“帧链”思维链机制,可实时生成UI、自动解迷宫并玩数独,多模态生成从“看得像”迈入“想得通”。官方将其比作视觉领域的GPT-3,意味着视频模型开始具备显式推理与交互能力,将加速自动驾驶、机器人与实时交互媒体落地。
03 | 具身智能与机器人感知升级
上交-剑桥联合提出注入几何先验的VLA框架,机器人操作成功率提升31%;智源开源零样本跨本体模型RoboBrain-X0,一次训练即可控制不同形态机械臂。Meta推出“安卓式”机器人平台,强调大模型+数据范式,让硬件、算法与数据层解耦,具身智能正走出实验室,向工业柔性产线与家庭服务场景渗透。
04 | 国产小模型逆袭与高效训练
北大-360联合推出的32B TinyR1在安全评测中碾压千亿级模型;陈丹琦团队8B RLMT用新型强化学习策略在推理任务上超越GPT-4o;LiquidAI Nanos系列把10B参数压缩至边缘可运行规模。算法层面的稀疏化、强化学习与知识注入验证了“小即美”路线,显著降低算力门槛,为私有化部署和边缘AI打开商业空间。
05 | AI基础设施与算力成本革命
浪潮信息基于DSA稀疏内核实现8.9 ms单请求推理、1元/百万token行业最低价;华为CloudMatrix384超节点上线即支持DeepSeek V3.2,展示国产硬件弹性。FlashAttention作者断言GPU垄断将在三年内被打破,软硬件协同优化正把大模型推理推向“白菜价”,为Agent大规模商用扫清成本障碍。
06 | OpenAI模型暗箱与信任危机
多名付费用户实测证实OpenAI在未告知情况下降级模型并植入安全模型过滤内容,引发“GPT门”集体投诉;马斯克第六次起诉OpenAI窃取商业机密。事件凸显闭源模型在透明度、可控性与商业伦理上的系统性风险,或进一步推高企业与政府市场对开源方案的需求。
07 | 中国模型屠榜与开源生态领先
阿里通义七款模型同时登顶Hugging Face,Qwen3-Omni拿下全球第一;蚂蚁百灵开源Ring-flash-2.0思考模型,阿里云发布Qwen3Guard安全护栏。国产模型在开源社区形成“群狼”效应,吸引大量海外开发者迁移,为中文数据与东方场景标准输出奠定基础。
【展望】当“稀疏注意力+超节点”把推理成本压到极限,当视频模型具备链式思维,当小参数模型在边缘端超越巨兽,AI产业正式从“堆算力”转向“拼效率”。开源与闭源的信任鸿沟同步放大,预计更多企业与政府客户将优先选择可验证、可落地的国产开源方案;硬件、模型、数据三轮驱动下,Agent与具身智能的规模化商用或在未来两个季度进入爆发期。