2025-09-29 AI话题 - AI快开门

DeepSeek V3.2 稀疏注意力突破

DeepSeek 连续发布 V3.2-Exp 并开源 DSA 稀疏注意力机制，华为云、寒武纪第一时间完成适配，推理成本再降，国产大模型生态集体跟进，标志国产大模型从参数竞赛转向架构与系统级协同优化，对全球闭源模型形成技术对冲。

谷歌 Veo 3 被官方称为视觉领域“GPT-3 时刻”，可实时生成界面、自动解迷宫、玩数独，提出视频“帧链”思维链机制，显示多模态生成从“看得像”走向“想得通”，将加速自动驾驶、机器人及交互式媒体落地。

上交-剑桥提出注入几何先验的 VLA 方法，机器人操作成功率提升 31%；智源开源零样本跨本体 RoboBrain-X0；Meta 推出安卓式机器人平台，大模型+数据成为新范式，具身智能正从实验室走向工业与家庭场景。

北大-360 的 32B TinyR1、陈丹琦 8B RLMT、LiquidAI Nanos 等轻量模型通过算法创新在安全、推理、边缘端任务上超越千亿级巨兽，验证“小即美”路线，降低算力门槛，推动端侧部署与私有化落地。

浪潮信息实现 8.9 ms 推理、1 元/百万 token 新纪录；华为 CloudMatrix384 超节点第一时间支持 DeepSeek V3.2；FlashAttention 作者预言 GPU 垄断三年内终结，硬件-软件协同优化正把 AI 推理推向“白菜价”时代。

OpenAI 被曝多次在未告知付费用户情况下降级模型、植入安全模型过滤内容，引发“GPT 门”集体投诉；马斯克第六次起诉其窃取商业机密，用户信任度骤降，凸显闭源模型在透明度与商业伦理上的系统性风险。

阿里通义七款模型登顶 Hugging Face，Qwen3-Omni 拿下全球第一；蚂蚁百灵开源 Ring-flash-2.0 思考模型；阿里云发布 Qwen3Guard 安全护栏，国产模型在开源社区形成“群狼”效应，加速全球开发者向东方迁移。