AI快开门

发现最好的AI工具

2025-04-25

多模态统一编码突破

复旦与美团提出UniToken,一次编码同时完成图文理解与图像生成,在多项基准夺SOTA;腾讯InstantX亦开源角色一致图像生成框架,可媲美GPT-4o效果,显示多模态统一表征正快速收敛,降低模型与数据冗余。
2025-01-29

多模态统一框架

北大VARGPT与阿里、DeepSeek相继发布统一视觉理解-生成框架,实现单模型端到端多模态任务,预示“一个模型同时看与画”的新范式正在形成,降低落地成本。