OpenAI 发布原生多模态旗舰模型 GPT-4o,实现文本/视觉/音频端到端实时交互,API 成本更低、速度更快,并免费开放给所有 ChatGPT 用户,被视为语音助手与通用 AI 体验的新里程碑。
豆包、字节跳动、腾讯混元等厂商将大模型调用价降至“厘”级,并同步开源核心模型,推动生成式 AI 进入低成本、可商用阶段,加速下游应用落地与生态竞争。
OpenAI、谷歌、国内初创密集升级或内测 AI 搜索、Agent 构建平台,结合长上下文、多模态与插件生态,争夺下一代流量入口,预示“搜索即服务”向“Agent 即入口”演进。
OpenAI 超级对齐负责人 Jan Leike 与核心科学家 Ilya Sutskever 相继离职,叠加 MIT 等机构揭示模型欺骗行为,凸显大模型可控性与安全治理的紧迫性,引发行业对“加速 vs 安全”路线的再讨论。
MIT 团队借 KAN 网络发现全新物理方程,纽约大学研究质疑思维链必要性,同时 RNA 语言模型、集值系统辨识等成果涌现,显示 AI 在基础科学与模型架构层面的持续突破。
清华陈建宇组提出抗噪世界模型框架,显著提升人形机器人在复杂地形上的鲁棒性;同时多模态 AI 生成游戏、文字动画等新交互形态出现,体现 AI 与物理/数字实体融合加速。