【概览】OpenAI以Codex编程智能体与“All-in-One”GPT-5路线图率先吹响统一智能体号角;谷歌借I/O前夕密集释放Gemini搜索入口革命,正面迎击。硬件、Agent、多模态与科研AI同步突破,资本与政策震荡加剧,全球AI生态进入“模型-入口-算力-标准”四维竞速新周期。
01 | OpenAI全能模型与编程智能体
OpenAI一周内连发Codex编程智能体并官宣GPT-5“All-in-One”战略,计划将Codex、Operator、Deep Research等能力模块熔铸成单一全能助手,终结多模型切换时代。开发者获得云端“零延迟”代码执行环境,终端用户则通过统一对话界面调用深度研究、操作系统的复杂任务,标志着大模型从“工具箱”向“智能代理”跃迁,交互范式与商业模型面临重塑。
02 | 谷歌Gemini重塑搜索与交互入口
I/O 2025倒计时之际,谷歌启动Gemini AI搜索引擎灰度测试,传统搜索框将被生成式问答界面取代;NotebookLM新增AI视频概览,搜索AI Mode实验同步上线。连续动作显示谷歌正把Gemini嵌入核心流量入口,以“AI-first”体验锁定十亿级日活,提前卡位下一代信息分发话语权。
03 | AI硬件创新:高通、英伟达与国产芯片
高通携低功耗AI芯片重返数据中心,正面挑战英伟达;黄仁勋发布全新GeForce GPU与800GB桌面超算,单机能装下1.5个满血DeepSeek R1。华为联合DeepSeek推出高推理性能方案,北大-曦智提出高带宽域架构,国产芯片在算力与互联层面集体突破,AI硬件进入“多元竞速+垂直优化”并行时代。
04 | AI Agent生态爆发:标准、框架与场景落地
微软牵头制定跨公司AI代理标准协议,为不同厂商智能体互操作铺路;GenSpark发布全球首个Agentic下载代理,阿里通义ZeroSearch让模型无需API即可“自演”搜索。中信证券指出管理软件是Agent最快变现场景,协议统一、场景深耕与商业闭环三股力量交汇,AI Agent生态进入“可用、可管、可赚”阶段。
05 | 多模态与视频生成新范式
B站开源AniSora动画模型并获IJCAI25认可,匹兹堡大学PhyT2V无需重训练即可将视频物理真实度提升2.3倍,Stability与Arm联手把11秒立体声生成搬进手机端。动画、视频、音频同步突破,多模态创作工具链门槛大幅降低,UGC与AIGC边界加速消融。
06 | 科研AI与数学算法突破
谷歌AlphaEvolve自我进化打破56年矩阵乘法效率纪录,港中文新算法再节省5-10%能耗;康奈尔基于800万数据用GNN预测肺癌生存期并发现3类致命亚型。FDA宣布6月30日前全面部署AI审查,科研效率与监管效率同步跃升,AI正成为基础科学与公共健康的“加速器”。
07 | 资本与政策震荡:美科研经费削减与全球人才流动
特朗普政府砍掉哈佛30亿美元科研经费,350个项目停摆;欧盟趁机推出高额资助吸引美国科学家。Anthropic获25亿美元信贷额度,年收入飙升至20亿美元。政策与资本双重力量加速全球AI人才与资源再分配,科研重镇与创业高地面临新一轮洗牌。
【展望】当“统一智能体”遇上“搜索入口革命”,模型能力、流量入口与硬件算力正在同一周内完成耦合。接下来,跨厂商Agent协议能否快速落地、低功耗芯片能否打破垄断、多模态工具能否催生新一代内容平台,将决定AI生态从“技术爆发”走向“价值爆发”的速度与广度。