2026-05-04

模型效率与架构创新

中科院瞬悉2.0、DeepSeek Mega MoE及SonicMoE等方案,针对长序列与低功耗场景优化架构,显著降低推理成本,为端侧部署和多模态交互提供高效替代,缓解Transformer规模瓶颈。