空间智能 - AI话题 - AI快开门

2026-05-25

具身智能与机器人突破

蚂蚁灵波因果世界模型论文被RSS 2026接收，实现机器人边推演边行动；李飞飞团队发布ESI-Bench具身智能基准测试；英伟达在新加坡设立具身智能实验室；华为具身大脑负责人创业获亿元融资；奥比中光转型物理AI视觉基础设施。显示具身智能成为AI落地物理世界的关键方向。

具身智能机器人世界模型物理AI 空间智能

2026-05-23

具身智能与空间智能

具身智能成为AI理解物理世界的关键方向，李飞飞团队发布空间智能基准ESI-Bench，视启未来等团队布局隐空间世界模型，推动AI从"看见"向"预见"演进，物理AGI体系逐步成型。

具身智能世界模型空间智能视觉大模型物理AGI

2026-05-22

具身智能与物理世界AI

该主题聚焦AI向物理世界的延伸与具身智能发展，包括国家发改委部署具身智能训练基础设施、李飞飞推出空间智能数据集、顺丰邮政仓库机器人通过"具身高考"，以及人形机器人核心零部件国产突破等。这些进展标志着AI正从数字世界迈向物理世界，"大小脑"模型训练、真实场景数据获取与硬件工程化成为竞争关键，预示具身智能产业爆发前夜的基础设施布局。

具身智能空间智能机器人物理世界 AI基础设施

2026-04-18

空间智能与数字员工

澜舟科技推出可信 AI 技术体系，以数字员工重构企业服务；ACL 2026 论文揭示大模型空间认知短板，空间智能与行业落地双向推进。

空间智能数字员工可信AI

2026-04-17

具身智能大爆发

谷歌、高德、智平方等集中发布具身大脑/机器人模型，π0.7被称“机器人GPT-3时刻”；18家顶尖团队启动全球最大具身模型竞技场；4.55亿美元中国单笔最大融资注入，技术、资本、赛事三箭齐发，标志具身智能进入规模落地拐点。

具身智能机器人大模型空间智能融资竞技场

2026-01-25

世界模型资本热

李飞飞创业公司一年估值翻5倍并洽谈5亿美元新融资，显示“世界模型”成为继大语言模型后资本最追捧的叙事，空间智能与物理世界模拟或接棒生成式文本成为2026年最大资金蓄水池。

世界模型李飞飞融资空间智能

2025-11-17

世界模型路线之争

李飞飞发布Marble、LeCun离职Meta创业、谷歌Genie 3亮相，三位顶级学者同步押注世界模型，预示AGI技术路线从“大语言”转向“空间智能”，可能重塑下一代AI架构。

世界模型空间智能 AGI LeCun 李飞飞

2025-11-13

空间智能与世界模型商用化

李飞飞World Labs发布首款3D世界模型Marble并开放免费版，可灵2.5Turbo上线“首尾帧”可控视频生成，宇树G1-D工作站实现人形机器人采集-训练-部署闭环，显示AI正从语言空间走向三维物理世界，空间智能进入可商用落地拐点。

空间智能世界模型 3D生成人形机器人可控视频

2025-11-12

具身智能与机器人产业化

地平线VP创业无界动力获3亿元天使，小鹏IRON团队曝光，俄罗斯Aidol摔倒出圈，李飞飞定义“空间智能”世界模型，具身赛道从Demo走向量产前夜。

具身智能人形机器人空间智能量产

2025-11-11

空间智能成AGI新战场

李飞飞、谢赛宁、LeCun等顶级学者连续发声，提出“空间智能”是通向通用人工智能的下一站；商汤、Moonshot等同步发布开源空间模型，在多项评测中超越GPT-5，标志着AI从被动识图向主动理解三维世界跃迁，将重塑机器人、XR及自动驾驶的技术栈与产业格局。

空间智能 AGI 商汤李飞飞开源模型

2025-08-15

AI+机器人与空间智能落地

宇树H1获机器人史上首枚1500米金牌，HTC 49克超轻AI眼镜挑战Meta，文远知行获Grab数千万美元投资将大规模部署东南亚Robotaxi，硬件与AI融合进入场景验证期。

机器人空间智能 AI眼镜 Robotaxi 宇树

2025-06-22

大模型空间推理突破

ViLaSR-7B通过三阶段“边看边画”训练，在5项空间基准平均提升18.4%，刷新VSI-Bench SOTA，标志着大模型具备人类级空间思考与导航能力，为机器人、AR/VR应用奠基。

空间智能视觉推理 ViLaSR VSI-Bench 导航

2025-06-21

多模态生成与3D/空间智能

华为云盘古大模型实现点云+视频联合4D生成，可基于单张火星图构建全局一致空间漫游；清华VGGT获CVPR2025最佳论文，秒级3D视觉推理；国产SOTA绘图模型攻克“画(3+6)条命的动物”推理难题，显示多模态理解与生成进入空间智能新阶段。

多模态生成 3D视觉空间智能盘古 VGGT

2025-06-02

多模态与评测基准

360开源1200万细粒度图文对数据集FG-CLIP，浙大等发布5700问空间智能评测基准，双双瞄准“模型幻觉”与“空间盲区”，为多模态大模型提供更高阶的试金石。

多模态图文对齐空间智能评测基准 FG-CLIP

2025-01-03

国产多模态大模型突破

字节Infinity、VAR及北大空间智能模型在文生图、3D场景代码生成等任务上刷新SOTA，显示国产模型正从跟随转向并行领跑，为AIGC、元宇宙及机器人导航提供核心能力。

Infinity VAR 空间智能文生图多模态

2024-12-24

多模态空间智能突破

李飞飞&谢赛宁连发研究证实多模态大模型内部已自发形成“空间大脑”，可记忆与推理三维布局；同时DisPose、Sketch2Sound等新工具实现视频驱动舞蹈、文本+声音生成高保真音频，标志AI正从“看懂”走向“操作”物理世界，为AR/VR、机器人导航打开新场景。

空间智能多模态世界模型 3D感知具身智能

2024-12-23

多模态与空间智能突破

李飞飞团队提出多模态空间智能框架，显著提升MLLM视觉推理；谢赛宁等证明空间推理是性能突破关键；清华腾讯ColorFlow自动上色保持角色一致；华中科大VisionFM实现眼科精准诊断。空间感知与一致性成为多模态下一站核心。

空间智能多模态 MLLM 视觉推理一致性

2024-12-03

视频/3D生成大爆发

腾讯、生数、阶跃星辰等集中发布开源或内测视频大模型；李飞飞创业首秀“单图生成交互3D世界”标志空间智能进入可体验阶段，内容创作与元宇宙基础设施被快速重写。

视频生成 3D场景空间智能开源模型 AIGC

2024-11-22

空间智能与3D生成

宝可梦GO团队发布150万亿参数LGM全球3D地图、东京大学提出时态域泛化框架、国内团队推出无限交互式视频模拟器“The Matrix”，预示AI开始从二维像素升维到三维世界建模，为AR/VR、自动驾驶提供实时可交互的数字孪生底座。

空间智能 3D地图数字孪生时态泛化世界模型

2024-10-07

空间&3D视觉技术升温

李飞飞创办 World Labs 强调“空间智能与语言同等根本”，ECCV 2024 的新 3D 场景生成方法实现高质量视角一致，科研与创业同步推进，预示下一代 AR/VR、具身智能所需的三维理解将快速成熟。

空间智能 3D生成 World Labs 具身智能 ARVR