AI快开门

发现最好的AI工具

2025-07-08

模型架构与训练效率革新

清华SageAttention3实现5倍注意力提速,循环模型500步突破256k长度泛化,基于能量Transformer提升35%性能,后训练与量化技术成为缓解算力瓶颈的关键路径。