AI快开门

发现最好的AI工具

2025-05-30

人形机器人与具身智能

Figure合并团队发布Helix、上海出台数据生态政策、HopeJR 3000美元开源机、波士顿动力Atlas秀3D感知,显示人形机器人正从demo走向量产前夜,硬件成本下降与运动大模型是关键推手。
2025-02-13

视频/多模态生成技术突破

快手CineMaster、阿里Animate Anyone 2、谷歌Whisk、Adobe Firefly等集中发布,实现3D感知精准视频生成、人物动作表情迁移、图文一键混剪短视频;Magic 1-For-1 1分钟长视频模型亮相,显示多模态AIGC进入可控高分辨率时代。
2024-12-24

多模态空间智能突破

李飞飞&谢赛宁连发研究证实多模态大模型内部已自发形成“空间大脑”,可记忆与推理三维布局;同时DisPose、Sketch2Sound等新工具实现视频驱动舞蹈、文本+声音生成高保真音频,标志AI正从“看懂”走向“操作”物理世界,为AR/VR、机器人导航打开新场景。
2024-01-21

目标检测架构再进化

YOLO-Former 将 Transformer 注意力与 YOLOv4 融合,在保持实时性的同时刷新精度;浙大 UniVision 统一占用预测与目标检测,为自动驾驶提供一站式 3D 感知框架。