AI快开门

发现最好的AI工具

2025-04-30

多模态与4D视觉突破

TesserAct提出4D场景理解框架,谷歌Genie 2生成可交互3D环境,Luma Ray2 API实现电影级镜头控制,阶跃发布开源图像编辑SOTA,显示多模态正从“看得清”走向“看得懂+控制得了”,为机器人、影视及XR应用打开新空间。