2026-01-16

AI视频生成再升级

Google Veo 3.1、Higgsfield、腾讯混元动作大模型等同步迭代,多图一致性、4K超分、竖版原生、3D动作生成成为新卖点,推动AI视频从“演示”走向“生产”,广告、短剧、动画等内容产业将率先受益。
2025-05-20

多模态生成与视频超分SOTA

谷歌Imagen 4系列登陆GCP,腾讯混元游戏视觉生成平台“边画边出图”,KEEP提出融合卡尔曼滤波的视频人脸超分SOTA,B站开源二次元动画模型Index-AniSora,多模态生成进入高保真、高一致性时代。
2025-05-05

视觉与多模态前沿

CVPR 2025 Oral DiffFNO实现任意尺度超分辨率,港科广亚毫米级3D人体生成;o3仅凭单图定位地球坐标,显示视觉大模型在精细几何与地理推理上的跨越,将推动AR/VR、遥感及内容创作升级。
2025-03-17

多模态与3D生成技术突破

港科大广州与趣丸提出Uni-Renderer单模型完成渲染+逆渲染,腾讯混元3D开源,Thera开源超分、LBM一键改光照去路人,CVPR 2025多篇论文推进跨模态因果对齐,内容创作门槛进一步降低。
2024-01-02

多模态生成突破

阿里AnyText解决AI绘图“不会写字”顽疾,支持中英日韩四语精准嵌入;Meta、腾讯相继公布视频-视频、高清纹理生成方案;NTU Upscale-A-Video把经典番剧秒变4K,显示多模态大模型正从“看得懂”走向“画得出、写得准、变得真”。