OpenAI 发布首批“用图像思考”的推理模型 o3 与 o4-mini,支持自主调用工具、多模态深度推理,性能十倍于 o1,同步开源 Codex CLI,标志视觉推理与 Agent 能力迈入新阶段,被业内视为 AGI 曙光。
快手可灵 2.0、阿里通义万相 Wan2.1-FLF2V、腾讯 InstantCharacter、生数科技多模态模型等密集开源或升级,实现首尾帧高清视频、角色一致性生成、实时可控交互,推动 AIGC 进入“完全个性化”时代。
腾讯、蚂蚁、AWS 等先后将 MCP(模型上下文协议)接入知识引擎与支付工具,Blender-MCP、Supermemory MCP 等开源项目涌现,配合 OpenAI 34 页 Agent 实战指南,降低智能体开发门槛,推动“3 分钟搭 Agent”时代。
微软 1-bit BitNet 仅 0.4GB 内存跑 2B 模型,联发科天玑 9400+ 提出 AGENTIC AI UX,RTX 5060 Ti 凭 DLSS 4 本地跑 32B 大模型,显示“手机+PC”端侧轻量化部署进入实用阶段。
智谱 Z 基金 3 亿+北京 2 亿追加、Moonvalley 4300 万美元 B 轮、X-ORIGIN-AI 近亿元 A 轮,叠加通义万相、混元 InstantCharacter 连续开源,显示国产模型“开源+资本”双轮驱动进入快车道。