AI快开门

发现最好的AI工具

2024-07-12

Transformer核心优化突破

FlashAttention-3与LowMemoryBP相继发布,H100利用率飙至75%,显存与速度兼得;训练GPT-2成本跌破700美元,反向传播效率再升级,为大模型普及与端侧部署奠定工程基础。