3D感知 - AI话题 - AI快开门

2025-05-30

Figure合并团队发布Helix、上海出台数据生态政策、HopeJR 3000美元开源机、波士顿动力Atlas秀3D感知，显示人形机器人正从demo走向量产前夜，硬件成本下降与运动大模型是关键推手。

2025-02-13

快手CineMaster、阿里Animate Anyone 2、谷歌Whisk、Adobe Firefly等集中发布，实现3D感知精准视频生成、人物动作表情迁移、图文一键混剪短视频；Magic 1-For-1 1分钟长视频模型亮相，显示多模态AIGC进入可控高分辨率时代。

2024-12-24

李飞飞&谢赛宁连发研究证实多模态大模型内部已自发形成“空间大脑”，可记忆与推理三维布局；同时DisPose、Sketch2Sound等新工具实现视频驱动舞蹈、文本+声音生成高保真音频，标志AI正从“看懂”走向“操作”物理世界，为AR/VR、机器人导航打开新场景。

2024-01-21

YOLO-Former 将 Transformer 注意力与 YOLOv4 融合，在保持实时性的同时刷新精度；浙大 UniVision 统一占用预测与目标检测，为自动驾驶提供一站式 3D 感知框架。

# 3D感知