【概览】GPT-4.5通过图灵测试、Gemini-2.5-pro登顶数学榜,字节DreamActor-M1直追Runway,多模态能力同日迈过“类人”门槛;与此同时,OpenAI o3单次任务成本飙至3万美元,高性能AI的经济与治理红线同步拉响。技术狂欢与成本警钟交织,AGI下一跳已近在眼前,却也更贵、更敏感、更不可控。
01 | 多模态大模型突破
GPT-4.5在标准图灵测试中以73%欺骗率刷新75年纪录,Gemini-2.5-pro在MathArena评测中碾压同级模型,字节跳动DreamActor-M1实现角色表演级动画生成——视觉、语言与推理的边界在同日消失,多模态大模型正式迈入“类人可用”阶段,为AGI奠定关键一跃。
02 | AI成本与治理警钟
OpenAI o3单任务成本从3000美元暴涨至3万美元,维基媒体控诉AI爬虫拖垮带宽,谷歌DeepMind对核心论文下达6个月发表禁令——性能越顶尖,经济、伦理与地缘风险越尖锐,高性能AI正进入“贵到用不起、敏到不敢用”的新阶段。
03 | 国产大模型与芯片突围
百度飞桨3.0框架升级、文小言语音交互成本砍90%,深圳“灵羽”RISC-V服务器芯片跑通满血DeepSeek-R1——国产AI在框架、语音与算力三线同步突围,大模型“中国底座”初现雏形。
04 | AI+教育场景落地
Anthropic启动“AI进校园”,Claude for Education聚焦批判性思维;NotebookLM新增“Discover Sources”自动搜集,腾讯元宝收藏夹多端同步——大模型从“助教”升级为“学习基础设施”,高校与终身学习入口被重写。
05 | AI生成内容商业化提速
即梦3.0直出2K商业海报、ChatGPT手写草书图片上线、Meta千元高端眼镜Hypernova曝光——AIGC完成从“玩具”到“生产力”的惊险一跃,设计、广告与硬件产业链迎来订单级冲击。
06 | 机器人与具身智能热潮
达闼爆雷、擎天柱秀走姿、港中文北大悬赏21万美金抢人——资本端收缩与赛事端烧钱同步上演,人形机器人进入“高波动抢人期”,商业化落地仍待验证。
【展望】当多模态大模型集体迈过“类人”门槛,性能曲线与经济曲线的剪刀差迅速扩大,成本、治理与地缘壁垒将成为下一阶段的核心变量;国产框架、芯片与教育场景的加速落地,则提供了平行世界的替代路径。接下来,行业焦点将从“做出更强大的模型”转向“谁能承担得起、控制得住、用得好”——AGI的门票,不只是技术,更是成本、规则与生态的综合竞赛。