Meta提出模态感知型混合专家、苹果免训练快慢双路视频理解、CogVideoX 2B开源商用级视频生成,以及DALL-E 3自动提示重写性能下降的发现,共同显示多模态大模型在架构、训练策略和推理效率上的快速迭代,为内容创作、自动驾驶、机器人等场景提供更强大、可控的生成与理解能力。
DeepMind乒乓球机器人达到人类中级水平,首次在真实对抗中赢下45%比赛,证明低成本视觉-动作策略可迁移到高速动态环境;结合量子性质逆向分子设计,显示AI正从虚拟走向物理世界,加速新材料、精密制造与机器人控制边界拓展。
Transformer“黑盒”被打开:新开源工具支持本地运行GPT-2并实时可视化注意力与推理路径,为研究社区提供低成本可解释性平台,有助于调试偏见、提升安全对齐,并推动教育及合规审计。
阿里等联合提出AI管理大型代码库方案,结合30秒生成1600面高精度Mesh的工具,显示生成式AI正从“写片段”升级为“管项目+管资产”,显著缩短游戏、工业设计与软件迭代周期。
DevRev获1亿美元融资打造AI Agent平台,毒舌AI凭一句提示词每分钟吸36用户、时赚2.8万美元,显示面向消费者与企业的Agent商业化进入加速期,资本与流量快速向“能自主完成任务+个性化体验”的团队集中。