AI快开门

发现最好的AI工具

2024-08-11

多模态与生成模型突破

Meta提出模态感知型混合专家、苹果免训练快慢双路视频理解、CogVideoX 2B开源商用级视频生成,以及DALL-E 3自动提示重写性能下降的发现,共同显示多模态大模型在架构、训练策略和推理效率上的快速迭代,为内容创作、自动驾驶、机器人等场景提供更强大、可控的生成与理解能力。
2024-02-10

模型小型化与MoE架构突破

北大、腾讯等推出的3B MoE-LLaVA以更少激活参数媲美7B稠密模型,Sebastian Raschka指出“大模型变小”已成年度趋势,模型合并+MoE成为主流方案,预示端侧部署与低成本推理将加速落地。