2025-05-20
多模态生成与视频超分SOTA
谷歌Imagen 4系列登陆GCP,腾讯混元游戏视觉生成平台“边画边出图”,KEEP提出融合卡尔曼滤波的视频人脸超分SOTA,B站开源二次元动画模型Index-AniSora,多模态生成进入高保真、高一致性时代。
2025-05-05
视觉与多模态前沿
CVPR 2025 Oral DiffFNO实现任意尺度超分辨率,港科广亚毫米级3D人体生成;o3仅凭单图定位地球坐标,显示视觉大模型在精细几何与地理推理上的跨越,将推动AR/VR、遥感及内容创作升级。
2025-03-17
多模态与3D生成技术突破
港科大广州与趣丸提出Uni-Renderer单模型完成渲染+逆渲染,腾讯混元3D开源,Thera开源超分、LBM一键改光照去路人,CVPR 2025多篇论文推进跨模态因果对齐,内容创作门槛进一步降低。