混合专家 - AI话题

2024-08-11

Meta提出模态感知型混合专家、苹果免训练快慢双路视频理解、CogVideoX 2B开源商用级视频生成，以及DALL-E 3自动提示重写性能下降的发现，共同显示多模态大模型在架构、训练策略和推理效率上的快速迭代，为内容创作、自动驾驶、机器人等场景提供更强大、可控的生成与理解能力。

2024-02-10

北大、腾讯等推出的3B MoE-LLaVA以更少激活参数媲美7B稠密模型，Sebastian Raschka指出“大模型变小”已成年度趋势，模型合并+MoE成为主流方案，预示端侧部署与低成本推理将加速落地。

AI快开门