AI快开门

发现最好的AI工具

2025-04-28

模型压缩与推理优化

莱斯大学DFloat11实现30%无损压缩且推理速度最高提升39倍,字节QuaDMix统一数据质量与多样性框架,ChatDLM提出扩散式语言模型新架构,共同指向大模型“瘦身”与“提速”成为继Scaling Law之后的新赛场,降低端侧与中小企业部署门槛。