2025-05-27 AI简报 - AI快开门

【概览】

谷歌、字节、昆仑万维同日抛出多模态“全家桶”，生成式AI首次在图像、视频、手语、医疗等场景同步可用；另一边，Claude 4、Office智能体、360 AI浏览器集体上线，Agent生态完成“工具-入口-平台”闭环。国产算力与医疗、教育、机器人赛道紧随其后，模型、芯片、应用三线共振，AI进入“全能模型+自主执行”并行冲刺阶段。

01 | 多模态大模型爆发

谷歌连发三大Gemma变体，解锁医疗影像、手语翻译甚至海豚声纹；字节开源BAGEL，用单一权重完成图像生成到世界建模；昆仑万维“天工超级智能体”把文档、视频、3D手语装进手机App。实测Veo3实现音画同步生成，多模态不再只是Demo，而是直接嵌入工作流，标志着“全能模型”正式接棒纯文本大模型，成为内容、教育、办公场景的新基座。

02 | AI智能体生态成型

Claude 4登陆Amazon Bedrock，向企业直接开放“工具调用+长时任务”API；昆仑万维发布全球首款Office智能体App，一句话自动完成PPT、表格与文献综述；360浏览器升级为AI浏览器，搜索、填表、脚本一键搞定；微软把生成式能力塞进画图、记事本等系统级应用。Agent不再只是Chat插件，而是接管本地与云端工具链的“操作系统层”，交互入口之争提前打响。

03 | 国产算力与芯片突围

面对新一轮出口限制，英伟达快速推出中国特供低价芯片保住份额；国内两家算力巨头合并组建4000亿元“国产算力航母”，目标年内交付超10 EFLOPS自主智算中心；上海交大开源电脑智能体框架，用312条轨迹把任务成功率提升241%，软件侧与硬件侧同步突围，为国产模型提供“用得起、跑得动”的闭环底座。

04 | AI+医疗科研突破

华中科大联合多家医院在Nature子刊发表多中心感染休克预测模型，把死亡率预测误差降到5%以内；中山大学发布8亿参数单细胞基础模型CellFM，用1亿人类细胞数据预训练，可直接预测药物响应；谷歌Gemma医疗变体把Med-PaLM能力蒸馏到20亿参数，手机端即可辅助问诊。AI正从“辅助读片”走向“精准预测+机制发现”，深入临床与科研核心环节。

05 | 教育场景AI渗透

最新发表于《Learning Science》的随机对照试验显示，使用ChatGPT的中小学生学习成效提升87%，记忆保持率提高42%；VideoTutor只需一句提示即可生成K12定制教学视频，并自动匹配教材知识点。生成式AI从“答疑小助手”升级为“个性化导师”，教师角色加速向学习设计师转型。

06 | 机器人与具身智能加速落地

智元机器人启动灵犀X2合作伙伴招募，计划2026年出货数千台，价格带下探至20万元级；优必选携手中国电信发布桌面级家庭机器人，瞄准老人陪护与儿童教育；杭州举办全球首场机器人格斗赛，人形机器人完成空翻+拳击组合动作，娱乐化场景加速C端认知。供应链成熟与模型泛化双重推动，具身智能进入“量产+内容”并行期。

【展望】

当多模态“全能模型”与可自主执行的Agent在同一周内集体上线，AI不再只是“更好的软件”，而成为替代部分脑力与体力流程的新基础设施。接下来，谁能把低价算力、端侧推理与行业知识库最快打包成“交钥匙”方案，谁就能抓住第一波真正的规模化红利。

AI快开门

发现AI的无限可能