2025-12-14
世界模型与多模态生成
Runway发布通用世界模型GWM系列,可同步模拟环境、人物与机器人操作;谷歌升级Gen-4.5,SIGGRAPH Asia亦展示30→200FPS的4D重建方案。生成式AI正从“出图”走向“出世界”,为影视、机器人和元宇宙提供可交互的物理一致场景,重新定义内容生产管线。
2024-10-28
超长视频理解大模型突破
智源Video-XL、极佳DriveDreamer4D及清华VERIFIED等研究,把单卡理解电影级长视频、4D场景重建与细粒度片段标注推向新高度,为自动驾驶、媒体生产解锁小时级甚至电影级AI理解能力,长视频赛道进入可用阶段。