【概览】
谷歌、字节、昆仑万维同日抛出多模态“全家桶”,生成式AI首次在图像、视频、手语、医疗等场景同步可用;另一边,Claude 4、Office智能体、360 AI浏览器集体上线,Agent生态完成“工具-入口-平台”闭环。国产算力与医疗、教育、机器人赛道紧随其后,模型、芯片、应用三线共振,AI进入“全能模型+自主执行”并行冲刺阶段。
01 | 多模态大模型爆发
谷歌连发三大Gemma变体,解锁医疗影像、手语翻译甚至海豚声纹;字节开源BAGEL,用单一权重完成图像生成到世界建模;昆仑万维“天工超级智能体”把文档、视频、3D手语装进手机App。实测Veo3实现音画同步生成,多模态不再只是Demo,而是直接嵌入工作流,标志着“全能模型”正式接棒纯文本大模型,成为内容、教育、办公场景的新基座。
02 | AI智能体生态成型
Claude 4登陆Amazon Bedrock,向企业直接开放“工具调用+长时任务”API;昆仑万维发布全球首款Office智能体App,一句话自动完成PPT、表格与文献综述;360浏览器升级为AI浏览器,搜索、填表、脚本一键搞定;微软把生成式能力塞进画图、记事本等系统级应用。Agent不再只是Chat插件,而是接管本地与云端工具链的“操作系统层”,交互入口之争提前打响。
03 | 国产算力与芯片突围
面对新一轮出口限制,英伟达快速推出中国特供低价芯片保住份额;国内两家算力巨头合并组建4000亿元“国产算力航母”,目标年内交付超10 EFLOPS自主智算中心;上海交大开源电脑智能体框架,用312条轨迹把任务成功率提升241%,软件侧与硬件侧同步突围,为国产模型提供“用得起、跑得动”的闭环底座。
04 | AI+医疗科研突破
华中科大联合多家医院在Nature子刊发表多中心感染休克预测模型,把死亡率预测误差降到5%以内;中山大学发布8亿参数单细胞基础模型CellFM,用1亿人类细胞数据预训练,可直接预测药物响应;谷歌Gemma医疗变体把Med-PaLM能力蒸馏到20亿参数,手机端即可辅助问诊。AI正从“辅助读片”走向“精准预测+机制发现”,深入临床与科研核心环节。
05 | 教育场景AI渗透
最新发表于《Learning Science》的随机对照试验显示,使用ChatGPT的中小学生学习成效提升87%,记忆保持率提高42%;VideoTutor只需一句提示即可生成K12定制教学视频,并自动匹配教材知识点。生成式AI从“答疑小助手”升级为“个性化导师”,教师角色加速向学习设计师转型。
06 | 机器人与具身智能加速落地
智元机器人启动灵犀X2合作伙伴招募,计划2026年出货数千台,价格带下探至20万元级;优必选携手中国电信发布桌面级家庭机器人,瞄准老人陪护与儿童教育;杭州举办全球首场机器人格斗赛,人形机器人完成空翻+拳击组合动作,娱乐化场景加速C端认知。供应链成熟与模型泛化双重推动,具身智能进入“量产+内容”并行期。
【展望】
当多模态“全能模型”与可自主执行的Agent在同一周内集体上线,AI不再只是“更好的软件”,而成为替代部分脑力与体力流程的新基础设施。接下来,谁能把低价算力、端侧推理与行业知识库最快打包成“交钥匙”方案,谁就能抓住第一波真正的规模化红利。