2025-12-25
具身智能与机器人升级
京东物流“智狼”机器人海外仓规模化落地,原力灵机发布GeoVLA赋予机器人3D视觉,清华-开创电气联合研究中心揭牌,亚马逊整合芯片+模型+机器人转向实体AI,显示具身智能正走出实验室进入产业闭环。
2025-11-15
多模态决策机制与3D视觉突破
研究首次揭示多模态大模型在冲突信息下“振荡”决策的内部机制,为提升可靠性提供理论依据;字节Depth Anything 3用极简自回归方案刷新3D视觉指标,获谢赛宁点赞,预示多模态技术正从性能走向可解释与高效。
2025-08-05
人形机器人感知与系统突破
北京与浙大团队分别发布全球首个人形机器人3D视觉感知系统与20亿神经元类脑计算机“悟空”,结合多模态传感与低功耗脉冲计算,为机器人通用环境理解与实时控制提供新范式,加速具身智能从实验室走向场景落地。
2025-06-21
多模态生成与3D/空间智能
华为云盘古大模型实现点云+视频联合4D生成,可基于单张火星图构建全局一致空间漫游;清华VGGT获CVPR2025最佳论文,秒级3D视觉推理;国产SOTA绘图模型攻克“画(3+6)条命的动物”推理难题,显示多模态理解与生成进入空间智能新阶段。