【概览】月之暗面、MiniMax 同日开源 72B 与 M1 代码大模型,以百万 token 窗口与 53 万美元训练成本刷新 SOTA,标志中国开源力量首次集体跻身全球第一梯队。自动驾驶、国防、科研、视频生成等多线并进,AI 向“更低成本、更长上下文、更高智能密度”加速收敛。
01 | 开源代码大模型爆发
月之暗面 Kimi-Dev-72B 与 MiniMax-M1 相继开源,在代码修复、超长上下文推理等基准上同时刷新 SOTA;72B 参数规模配合 1M token 窗口,训练成本仅 53 万美元,首次让“顶级性能+可复现+低成本”三者兼得。国产模型以开源姿态直接对标国际闭源旗舰,意味着开发者生态与行业落地将跳过“授权墙”进入高速迭代阶段。
02 | 自动驾驶Scaling Law验证
小鹏汽车在 CVPR 2025 主会场首次公布:用 6 亿秒真实行车视频训练大模型后,自动驾驶系统出现“智能涌现”,规划误差下降 60% 以上,验证了 Scaling Law 在物理世界复杂决策任务中的普适性。车厂从“硬件堆料”转向“数据+算力”指数级增长模式,被视为自动驾驶的“ChatGPT 时刻”。
03 | AI国防与政策风暴
OpenAI 拿下美国国防部 2 亿美元“前沿 AI”试点合同,特朗普团队 GitHub 提前泄密“全政府 AI 计划”拟 7 月 4 日上线,硅谷高管更组建陆军预备役“201 分队”。AI 首次深度嵌入国防采购、政务流程与军事编制,引发监管真空、伦理风险与反垄断调查多重震荡。
04 | AI for Science与医疗突破
240 亿参数化学推理模型准确率超 DeepSeek-R1 两倍;PanDerm 多模态皮肤病基础模型登顶 Nat. Med.;AI 仅用 2 天完成人类 12 年医学综述且错误率下降 15%;生成式 AI 扩展线粒体靶向工具包,蛋白递送效率提升 3 倍。科研“手工作坊”模式被大模型批量替代,学术产出进入“周”级迭代。
05 | 多模态视频生成内卷
Midjourney 正式推出视频生成,Poe 平台一日内上线即梦 3.0 与 Seedance 1.0 Lite,腾讯 LeVo 实现零样本音色克隆,浙大-vivo MagicTryOn 让模特边跳舞边实时换装。影视、广告、电商三大场景同时被“一键生成”逼近实拍质感,内容生产成本曲线再次陡峭下行。
06 | 模型架构与推理优化
谷歌公开承认 Transformer 注意力机制存在“二次方瓶颈”,路线图已启动架构重写;R-KV 把 KV Cache 压缩至 10% 实现无损推理,CMU 与英伟达 Multiverse 实现原生并行出 token。多条技术路径指向同一目标:更长上下文、更低功耗、更高吞吐,为大模型“飞入寻常设备”扫清道路。
07 | 搜索与浏览器AI原生重构
ChatGPT 搜索升级精准响应,LinkedIn 推出自然语言求职搜索告别关键词,企业搜索 Glean 再获 1.5 亿美元融资估值 72 亿美元;Arc 发布 AI 原生浏览器 Dia,把地址栏直接变成对话框。传统“搜索框+超链接”范式被彻底改写,浏览器入口价值面临重估。
【展望】国产开源代码模型以“低成本+长窗口”撕开生态缺口,自动驾驶 Scaling Law 验证后,车企或掀起新一轮“数据军备赛”;国防与政务订单落地,AI 监管框架将被迫加速成型;科研、视频、搜索等多点爆发,预示大模型进入“行业专用、架构重写、体验重构”的深水区。接下来六个月,性能红利与政策风险将同步放大,全球 AI 竞争正式进入“生态+合规”双轮驱动阶段。