AI快开门

发现最好的AI工具

2025-03-11

多模态与端侧推理提速

Zoom“草稿链”砍掉80%推理token,LayerSkip自推测解码加速大模型,字节开源MoE训练代码,RTX 5000 Ada成端侧新宠,显著降低延迟与成本,为端侧大模型规模化部署铺平道路。