2026-02-07
多模态与世界模型突破
MiniCPM-o 4.5实现全双工“边看边说”,清华开源统一世界模型性能超硅谷40%,Waymo×DeepMind用Genie 3让自动驾驶“脑补”罕见场景。多模态实时交互与世界模型成为下一个主战场。
2025-08-11
多模态生成与3D/视频模型爆发
谷歌Genie 3、阿里Wan2.1-I2V-Flash、虚拟试穿Voost、图生视频SkyReels-A3等密集发布,实现秒级交互式3D世界、高保真纹理还原及语音对口型,显示多模态生成正从“可用”走向“好用”,重塑电商、影视、UGC内容生产链。