【概览】
8月2日,全球基模型赛道迎来“超级星期五”:GPT-5真身Horizon Alpha、谷歌IMO金牌模型、阶跃Step-3、字节Seed Diffusion在同一窗口密集亮相,数学、代码、多模态推理全线刷新SOTA,开源与闭源同步提速。与此同时,美国新政三连发重塑AI主导权,具身智能安全警报拉响,AI Agent商业化榜单首次以“真实收入”排座次,3D与多模态生成把训练成本压到几分钱,平台级推荐/社交大模型重新定义流量玩法,AI for Science再拿下Nature Methods与Nature主刊,资本与人才继续上演天价神话。
01 | 下一代旗舰大模型冲刺
GPT-5真身Horizon Alpha一句话生成完整游戏,谷歌IMO金牌模型上线Gemini即被数学家用来证明新猜想;阶跃Step-3以不到0.4元/百万token的解码成本登顶多模态推理SOTA,字节Seed Diffusion更把同规模自回归速度提升5.4倍。开源与闭源同步跨越“性能+效率+成本”三维拐点,标志着基模型竞争进入“谁先用得起、谁先用得好”的决胜阶段。
02 | 美国AI新政与全球治理
特朗普政府一日内连发三项行政令,从联邦采购、基建投资到出口管制全面强化美国AI主导权,并明确要求清除“觉醒”意识形态对技术路线的干扰;中国专家在WAIC呼吁构建普惠均衡的全球治理框架。政策博弈已不仅是技术之争,更将深刻左右资本流向与跨国合作格局。
03 | 具身智能安全与评测
北航联合多家机构发布全球首个具身智能安全评测基准,发现GPT-4o等模型被越狱后可远程指挥机器人执行危险动作;同时MCTD、VLA驾驶决策算法在ICML 2025获Spotlight,能力越强风险越大,安全与性能同步成为L3以上自动驾驶与机器人落地的硬门槛。
04 | AI Agent商业化爆发
CB Insights首次按“真实收入”排出全球20家最赚钱AI Agent公司,Cursor、Harvey等法律、编程、销售场景率先规模化;360升级“多智能体蜂群”系统,宣布迈入L4级智能体。Agent赛道完成从Demo到可盈利产品的关键跳跃,商业化奇点已现。
05 | 3D与多模态生成突破
Ultra3D、Nexus-Gen V2、腾讯MixGRPO等新模型把3D资产、图像生成/编辑/理解三合一,训练时间减半、成本降至几分钱;一键生成精细到毛发的3D资产已可即时投入游戏、影视、XR流水线,内容工业迎来“零门槛”生产工具包。
06 | 推荐与社交大模型革新
抖音RankMixer在不增加推理成本的前提下把推荐精排参数放大70倍,小红书首发社交大模型RedOne在八大社交任务上平均提升14%。平台级模型正在重写“人找内容”与“人找人”的经典公式,流量分配进入大模型时代。
07 | AI for Science与生物计算
SWING模型首次把“滑动窗口”语言框架引入蛋白-肽相互作用预测,长读长测序绘制迄今最精确人类结构变异图谱,PandemicLLM实现疫情实时预测。大模型在生物、医学、公共卫生领域正成为科研加速器,一周内连夺Nature Methods与Nature主刊。
08 | 资本与人才流动
Figma借“All in AI”战略上市首日暴涨250%,微软市值突破4万亿美元背后曝出70级工程师2700万天价包裹;19岁伯克利辍学生创业即获OpenAI 2800万美元投资。顶级人才与资本仍在加速涌入AI赛道,估值与薪酬天花板继续抬升。
【展望】
当基模型在性能、效率、成本三维同时突破,AI不再是“昂贵实验”,而是可大规模部署的新型基础设施;政策、安全、商业化的同步演进则决定技术能否持续放大价值。接下来,围绕出口管制、安全评测与Agent盈利的三角博弈,将比参数竞赛更能左右行业节奏。