AI快开门

发现最好的AI工具

2025-04-30

多模态与4D视觉突破

TesserAct提出4D场景理解框架,谷歌Genie 2生成可交互3D环境,Luma Ray2 API实现电影级镜头控制,阶跃发布开源图像编辑SOTA,显示多模态正从“看得清”走向“看得懂+控制得了”,为机器人、影视及XR应用打开新空间。
2024-12-06

世界模型与智能体突破

谷歌Genie 2单图生成可交互3D世界,复旦等发布智能体社会综述,哈工深Optimus-1横扫Minecraft长任务。世界模型与智能体快速进化,为通用机器人与虚拟训练环境奠定新基座。