AI快开门

发现最好的AI工具

2024-10-21

原生多模态世界模型Emu3

智源研究院发布Emu3,仅凭“下一个token预测”统一完成文本、图像、视频的理解与生成,无需扩散或组合架构,验证Ilya“统一生成”猜想,被视为多模态新范式。开源权重与代码,已获社区数千星标,有望降低多模态研发门槛并加速下游应用落地。