2026-05-25

具身智能与机器人突破

蚂蚁灵波因果世界模型论文被RSS 2026接收,实现机器人边推演边行动;李飞飞团队发布ESI-Bench具身智能基准测试;英伟达在新加坡设立具身智能实验室;华为具身大脑负责人创业获亿元融资;奥比中光转型物理AI视觉基础设施。显示具身智能成为AI落地物理世界的关键方向。
2026-05-23

具身智能与空间智能

具身智能成为AI理解物理世界的关键方向,李飞飞团队发布空间智能基准ESI-Bench,视启未来等团队布局隐空间世界模型,推动AI从"看见"向"预见"演进,物理AGI体系逐步成型。
2026-05-22

具身智能与物理世界AI

该主题聚焦AI向物理世界的延伸与具身智能发展,包括国家发改委部署具身智能训练基础设施、李飞飞推出空间智能数据集、顺丰邮政仓库机器人通过"具身高考",以及人形机器人核心零部件国产突破等。这些进展标志着AI正从数字世界迈向物理世界,"大小脑"模型训练、真实场景数据获取与硬件工程化成为竞争关键,预示具身智能产业爆发前夜的基础设施布局。
2026-04-18

空间智能与数字员工

澜舟科技推出可信 AI 技术体系,以数字员工重构企业服务;ACL 2026 论文揭示大模型空间认知短板,空间智能与行业落地双向推进。
2026-04-17

具身智能大爆发

谷歌、高德、智平方等集中发布具身大脑/机器人模型,π0.7被称“机器人GPT-3时刻”;18家顶尖团队启动全球最大具身模型竞技场;4.55亿美元中国单笔最大融资注入,技术、资本、赛事三箭齐发,标志具身智能进入规模落地拐点。
2026-01-25

世界模型资本热

李飞飞创业公司一年估值翻5倍并洽谈5亿美元新融资,显示“世界模型”成为继大语言模型后资本最追捧的叙事,空间智能与物理世界模拟或接棒生成式文本成为2026年最大资金蓄水池。
2025-11-17

世界模型路线之争

李飞飞发布Marble、LeCun离职Meta创业、谷歌Genie 3亮相,三位顶级学者同步押注世界模型,预示AGI技术路线从“大语言”转向“空间智能”,可能重塑下一代AI架构。
2025-11-13

空间智能与世界模型商用化

李飞飞World Labs发布首款3D世界模型Marble并开放免费版,可灵2.5Turbo上线“首尾帧”可控视频生成,宇树G1-D工作站实现人形机器人采集-训练-部署闭环,显示AI正从语言空间走向三维物理世界,空间智能进入可商用落地拐点。
2025-11-12

具身智能与机器人产业化

地平线VP创业无界动力获3亿元天使,小鹏IRON团队曝光,俄罗斯Aidol摔倒出圈,李飞飞定义“空间智能”世界模型,具身赛道从Demo走向量产前夜。
2025-11-11

空间智能成AGI新战场

李飞飞、谢赛宁、LeCun等顶级学者连续发声,提出“空间智能”是通向通用人工智能的下一站;商汤、Moonshot等同步发布开源空间模型,在多项评测中超越GPT-5,标志着AI从被动识图向主动理解三维世界跃迁,将重塑机器人、XR及自动驾驶的技术栈与产业格局。
2025-08-15

AI+机器人与空间智能落地

宇树H1获机器人史上首枚1500米金牌,HTC 49克超轻AI眼镜挑战Meta,文远知行获Grab数千万美元投资将大规模部署东南亚Robotaxi,硬件与AI融合进入场景验证期。
2025-06-22

大模型空间推理突破

ViLaSR-7B通过三阶段“边看边画”训练,在5项空间基准平均提升18.4%,刷新VSI-Bench SOTA,标志着大模型具备人类级空间思考与导航能力,为机器人、AR/VR应用奠基。
2025-06-21

多模态生成与3D/空间智能

华为云盘古大模型实现点云+视频联合4D生成,可基于单张火星图构建全局一致空间漫游;清华VGGT获CVPR2025最佳论文,秒级3D视觉推理;国产SOTA绘图模型攻克“画(3+6)条命的动物”推理难题,显示多模态理解与生成进入空间智能新阶段。
2025-06-02

多模态与评测基准

360开源1200万细粒度图文对数据集FG-CLIP,浙大等发布5700问空间智能评测基准,双双瞄准“模型幻觉”与“空间盲区”,为多模态大模型提供更高阶的试金石。
2025-01-03

国产多模态大模型突破

字节Infinity、VAR及北大空间智能模型在文生图、3D场景代码生成等任务上刷新SOTA,显示国产模型正从跟随转向并行领跑,为AIGC、元宇宙及机器人导航提供核心能力。
2024-12-24

多模态空间智能突破

李飞飞&谢赛宁连发研究证实多模态大模型内部已自发形成“空间大脑”,可记忆与推理三维布局;同时DisPose、Sketch2Sound等新工具实现视频驱动舞蹈、文本+声音生成高保真音频,标志AI正从“看懂”走向“操作”物理世界,为AR/VR、机器人导航打开新场景。
2024-12-23

多模态与空间智能突破

李飞飞团队提出多模态空间智能框架,显著提升MLLM视觉推理;谢赛宁等证明空间推理是性能突破关键;清华腾讯ColorFlow自动上色保持角色一致;华中科大VisionFM实现眼科精准诊断。空间感知与一致性成为多模态下一站核心。
2024-12-03

视频/3D生成大爆发

腾讯、生数、阶跃星辰等集中发布开源或内测视频大模型;李飞飞创业首秀“单图生成交互3D世界”标志空间智能进入可体验阶段,内容创作与元宇宙基础设施被快速重写。
2024-11-22

空间智能与3D生成

宝可梦GO团队发布150万亿参数LGM全球3D地图、东京大学提出时态域泛化框架、国内团队推出无限交互式视频模拟器“The Matrix”,预示AI开始从二维像素升维到三维世界建模,为AR/VR、自动驾驶提供实时可交互的数字孪生底座。
2024-10-07

空间&3D视觉技术升温

李飞飞创办 World Labs 强调“空间智能与语言同等根本”,ECCV 2024 的新 3D 场景生成方法实现高质量视角一致,科研与创业同步推进,预示下一代 AR/VR、具身智能所需的三维理解将快速成熟。