AI快开门

发现最好的AI工具

2025-05-20

多模态生成与视频超分SOTA

谷歌Imagen 4系列登陆GCP,腾讯混元游戏视觉生成平台“边画边出图”,KEEP提出融合卡尔曼滤波的视频人脸超分SOTA,B站开源二次元动画模型Index-AniSora,多模态生成进入高保真、高一致性时代。
2025-05-05

视觉与多模态前沿

CVPR 2025 Oral DiffFNO实现任意尺度超分辨率,港科广亚毫米级3D人体生成;o3仅凭单图定位地球坐标,显示视觉大模型在精细几何与地理推理上的跨越,将推动AR/VR、遥感及内容创作升级。
2025-03-17

多模态与3D生成技术突破

港科大广州与趣丸提出Uni-Renderer单模型完成渲染+逆渲染,腾讯混元3D开源,Thera开源超分、LBM一键改光照去路人,CVPR 2025多篇论文推进跨模态因果对齐,内容创作门槛进一步降低。
2024-01-02

多模态生成突破

阿里AnyText解决AI绘图“不会写字”顽疾,支持中英日韩四语精准嵌入;Meta、腾讯相继公布视频-视频、高清纹理生成方案;NTU Upscale-A-Video把经典番剧秒变4K,显示多模态大模型正从“看得懂”走向“画得出、写得准、变得真”。