2026-01-29 AI简报 - AI快开门

【概览】

蚂蚁、腾讯、斯坦福在同一周内集中开源视觉-语言-动作（VLA）与图生图大模型，把“一脑多机”与“可编辑3D”推入工程化落地；谷歌Gemini 3驱动的对话式搜索、200美元级私有化编程Agent、AI原生科研工作空间等同步登场，显示大模型正从“能用”走向“随处可用”。资本端Anthropic传出3500亿美元估值新融资，云厂商与硬件巨头加码算力与光纤，整条产业链进入“开源+场景+军备”三浪叠加的2026新周期。

01 | 开源具身智能爆发

蚂蚁灵波科技开源国内首个跨本体VLA大模型LingBot-VLA，并同步放出后训练工具链；腾讯混元图像3.0以800亿参数刷新开源图生图性能；斯坦福团队推出可编辑3D生成框架，让“Nano Banana”秒变参数化资产。三者合力把机器人部署门槛降到千元级，并把3D内容制作拉入“可迭代”时代，硬件与创意生态面临洗牌。

02 | 搜索对话化革命

谷歌Gemini 3全面接管搜索，结果页变“连续对话”；雅虎借Claude模型复活品牌，推出Yahoo Scout；欧盟同日裁定谷歌必须在Android系统层向第三方AI开放入口。链接索引时代正式让位于对话中心，搜索流量与广告分配规则重写。

03 | 编程Agent普惠化

Allen AI开源SERA，400美元即可在私有代码库跑通多代理架构；月之暗面发布多模态Kimi Code，一键嵌入VSCode；Mistral Vibe 2.0引入“子代理”概念，把“写需求”直接变成“合并PR”。企业级软件开发成本一夜回到外包零头。

04 | AI科研工具集成化

OpenAI推出基于GPT-5.2的Prism“AI原生”工作空间，把实验设计、数据分析和论文草稿搬进同一窗格；Anthropic Claude深度集成Slack、Figma等工具，成为科研团队的“指挥中心”；斯坦福与英伟达借测试时强化学习（TTT）让开源模型在科学推理上反超闭源，科研范式被彻底重写。

05 | 大厂AI云军备赛

百度智能云将2026年AI收入增速目标翻倍至200%，并提前锁定20EFLOPS新增算力；Meta则豪掷60亿美元向康宁采购下一代低延迟光纤，为万亿参数级模型铺路。云厂商与硬件巨头同步扩容，预示算力竞赛进入“光纤级”内卷。

06 | AI音乐与视觉创作升级

昆仑万维Mureka V8旋律表现力超越Suno，支持60轨级配器与情绪控制；谷歌Gemini 3 Flash新增Agentic Vision，实现“专家级”看图问答。创作工具从“生成可用”走向“情绪可细调”，内容产业迎来质感升级。

07 | AI硬件场景落地

小米眼镜联合支付宝上线“无感支付”，用户停车缴费、健康管理只需“看一眼”。智能眼镜首次找到高粘性日常场景，为AI硬件规模化提供样板。

08 | 巨额融资与估值飙升

Anthropic被曝以3500亿美元估值寻求200亿美元新融资，红杉资本高调返场；个性化模型初创Mindverse、脑机接口团队ThetaWave亦获千万美元级注资。资本对生成式AI的胃口依旧“不计前嫌”。

【展望】

当VLA模型开源把机器人大脑做成“即插即用”，当搜索、编程、科研等核心场景被大模型一次性重写，2026年的竞争焦点已从“训练更大模型”转向“谁能把模型最快塞进真实世界”。随着算力、光纤、资本三轮驱动，上半年预计会看到第一波“开源VLA+低成本Agent”的规模化落地，硬件供应链与数据飞轮将成为下一个战场。

AI快开门

发现AI的无限可能

AI行业新闻简报 2026.01.29 周四