高分辨率 - AI话题

2025-06-10

多模态大模型技术突破

近期多模态大模型在视觉理解、视频生成、3D建模等方向密集突破：港大-英伟达高分辨率视觉注意力提速84倍，小红书开源1420亿参数“dots.llm1”，谷歌Veo 3一键生成360° 3D视频，Direct3D-S2以8卡GPU实现影视级3D开源。技术簇呈现“高质量+高效率+开源”趋势，将显著降低内容创作与具身智能门槛，推动XR、机器人和设计工业落地。

多模态视频生成 3D建模开源高分辨率

2025-04-29

多模态与生成式创新

Gen-4 References实现实时图像光影混合；英伟达3B参数DAM模型细节描述媲美GPT-4o；360开源FG-CLIP解决细粒度跨模态对齐；Meta TokenShuffle支持2048×2048高分辨率图像生成；Suno V4.5、FASHN v1.5等工具持续升级，多模态生成进入高保真、高分辨率时代。

多模态生成式AI 图像生成 CLIP 高分辨率

2025-01-05