【概览】谷歌Gemini 2.5 Flash用“思考预算”把推理成本砍到1/7,OpenAI o3/o4-mini以“高智商+低价”正面迎击,大模型竞争首次进入“按推理计费”精算阶段;同时,多模态AI在生命科学、材料化学连续登上Nature,人形机器人完成全球首个半马,AI Coding、MCP、垂直应用与资本动作同步升温,行业从“炫技”转向“算账”与“落地”并行。
01 | 混合推理模型价格战
谷歌Gemini 2.5 Flash首次把“思考预算”做成可开关旋钮:关闭推理,成本直降600%,性能仍与OpenAI o4-mini持平;几小时后,OpenAI抛出o3/o4-mini组合,强调“高智商”与“白菜价”双轨并行。巨头在同一周把“可控推理+极致性价比”做成明牌,标志着大模型竞争从参数军备转向“花多少Token买多少智能”的精算时代,开发者选型将首次以“单推理成本”而非“单参数成本”为核心指标。
02 | 多模态AI颠覆科学发现
Nature一周两篇封面观点:多模态基础模型可把基因组、蛋白、代谢、电镜图像跨组学“一锅端”,突破人类读不懂海量生物数据的瓶颈;国内哈工大“指令驱动全景感知”让模型不再只看画面主体,上海交大与EPFL用Transformer直接预测催化剂全局最低吸附能。生命科学、材料、化学同时出现“统一大模型”范式,AI从辅助工具升级为科学发现的“主引擎”。
03 | 人形机器人从炫技到实战
北京亦庄全球首个人形机器人半程马拉松鸣枪,天工机器人以2小时40分跑完21公里,运动稳定性通过“耐力考”;深圳智平方发布AlphaBot 2,在DeepSeek大模型加持下无需预训练即可完成叠衣服、倒垃圾等复杂家务。赛事+家用双场景落地,表明人形机器人进入“硬件耐力+模型通用”并重的产业拐点,实验室Demo正式走向真实世界。
04 | AI Coding工具红海厮杀
Cursor、Devin、GitHub Copilot稳居海外流量高地,国内Trae、通义灵码、文心快码、JetBrains AI Agent全线追击,功能从“补全代码”卷到“理解整个项目并一键交付可执行软件”。开发者对“自动Debug+端到端交付”需求升级,倒逼厂商在12-18个月内完成商业化卡位,窗口期正在迅速关闭。
05 | MCP生态引爆智能体开发
蚂蚁“百宝箱”平台把支付宝、高德等国民级API封装成标准化MCP(Model Context Protocol)服务,3分钟可生成“会支付、会导航”的智能体;智谱、Kimi、DeepSeek已原生接入。Model-as-a-Service大幅降低开发门槛,预计催生百万级轻量智能体,AI应用进入“无代码调用一切”阶段。
06 | AI垂直应用密集落地
飞猪“问一问”AI机酒套餐走红,邀请码被黄牛炒到500元;趣丸“天谱乐”让零乐理用户3分钟写完整首歌;Traini人宠翻译准确率达81.5%,登顶萌宠社交榜。旅游、音乐、宠物等细分场景率先跑出PMF,验证“大模型+深度服务”比“通用对话”更易变现,垂直数据正成为新护城河。
07 | 国产大模型获资本加注
北京人工智能产业投资基金再投智谱,金山云星流训推平台全面接入GLM系列推理模型;硅谷AI营养平台Fay凭3000名营养师实现5000万美元ARR,估值5亿美元。政策基金、产业云、垂直SaaS三路并进,资本偏好明确:有收入、有数据、有场景,比纯技术故事更值钱。
08 | AI芯片出口管制再博弈
美国临时搁置对英伟达H20的对华出口限制,引发股价剧烈波动;英特尔新CEO陈立武出售Altera 51%股份,集中资源押注AI芯片与先进封装。中美科技脱钩阴影下,国产GPU、云端推理优化、混合推理降本成为替代H20的三大突破口,政策不确定性仍是本土算力供应链的最大变量。
【展望】当“思考预算”成为新计价单位,大模型竞争正式从“谁更聪明”转向“谁更便宜且可控”,开发者将首次拥有像调节云带宽一样调节推理深度的权力;多模态AI在基础科研的连续突破,预示“科学智能”将继“对话智能”之后成为下一波算力消费主力;人形机器人、AI Coding、MCP等场景同步进入商业化冲刺,资本与政策对“收入+数据+场景”的偏好愈发明显。未来6-12个月,能否在“可控成本”与“垂直落地”之间找到可持续的商业模式,将决定各家公司在后参数时代的话语权。