DeepSeek 连续发布 V3.2-Exp 并开源 DSA 稀疏注意力机制,华为云、寒武纪第一时间完成适配,推理成本再降,国产大模型生态集体跟进,标志国产大模型从参数竞赛转向架构与系统级协同优化,对全球闭源模型形成技术对冲。
谷歌 Veo 3 被官方称为视觉领域“GPT-3 时刻”,可实时生成界面、自动解迷宫、玩数独,提出视频“帧链”思维链机制,显示多模态生成从“看得像”走向“想得通”,将加速自动驾驶、机器人及交互式媒体落地。
上交-剑桥提出注入几何先验的 VLA 方法,机器人操作成功率提升 31%;智源开源零样本跨本体 RoboBrain-X0;Meta 推出安卓式机器人平台,大模型+数据成为新范式,具身智能正从实验室走向工业与家庭场景。
北大-360 的 32B TinyR1、陈丹琦 8B RLMT、LiquidAI Nanos 等轻量模型通过算法创新在安全、推理、边缘端任务上超越千亿级巨兽,验证“小即美”路线,降低算力门槛,推动端侧部署与私有化落地。
浪潮信息实现 8.9 ms 推理、1 元/百万 token 新纪录;华为 CloudMatrix384 超节点第一时间支持 DeepSeek V3.2;FlashAttention 作者预言 GPU 垄断三年内终结,硬件-软件协同优化正把 AI 推理推向“白菜价”时代。
OpenAI 被曝多次在未告知付费用户情况下降级模型、植入安全模型过滤内容,引发“GPT 门”集体投诉;马斯克第六次起诉其窃取商业机密,用户信任度骤降,凸显闭源模型在透明度与商业伦理上的系统性风险。
阿里通义七款模型登顶 Hugging Face,Qwen3-Omni 拿下全球第一;蚂蚁百灵开源 Ring-flash-2.0 思考模型;阿里云发布 Qwen3Guard 安全护栏,国产模型在开源社区形成“群狼”效应,加速全球开发者向东方迁移。