2026-05-23

具身智能与空间智能

具身智能成为AI理解物理世界的关键方向,李飞飞团队发布空间智能基准ESI-Bench,视启未来等团队布局隐空间世界模型,推动AI从"看见"向"预见"演进,物理AGI体系逐步成型。
2026-05-23

多模态与视觉技术

多模态技术持续突破,视觉大模型通过"特工大脑"等压缩技术提升效率,动漫风格生成模型Anima V1开源,音视频大模型综述梳理技术全景,推动生成式AI向专业化、细分场景深化。
2024-10-20

多模态与视觉大模型

谷歌&MIT何恺明团队证明视觉大模型可像LLM一样高效扩展;斯坦福VideoAgent让视频生成模型自我优化成智能体;国产3D虚拟人落地迪拜,显示多模态AI正从研究走向场景落地。