2026-01-16
AI视频生成再升级
Google Veo 3.1、Higgsfield、腾讯混元动作大模型等同步迭代,多图一致性、4K超分、竖版原生、3D动作生成成为新卖点,推动AI视频从“演示”走向“生产”,广告、短剧、动画等内容产业将率先受益。
2025-05-20
多模态生成与视频超分SOTA
谷歌Imagen 4系列登陆GCP,腾讯混元游戏视觉生成平台“边画边出图”,KEEP提出融合卡尔曼滤波的视频人脸超分SOTA,B站开源二次元动画模型Index-AniSora,多模态生成进入高保真、高一致性时代。
2025-05-05
视觉与多模态前沿
CVPR 2025 Oral DiffFNO实现任意尺度超分辨率,港科广亚毫米级3D人体生成;o3仅凭单图定位地球坐标,显示视觉大模型在精细几何与地理推理上的跨越,将推动AR/VR、遥感及内容创作升级。
2025-03-17
多模态与3D生成技术突破
港科大广州与趣丸提出Uni-Renderer单模型完成渲染+逆渲染,腾讯混元3D开源,Thera开源超分、LBM一键改光照去路人,CVPR 2025多篇论文推进跨模态因果对齐,内容创作门槛进一步降低。