算力节省 - AI话题

2025-04-23

清华、达摩院、复旦等集中开源DyDiT、MAGI-1、Suna等模型与框架，训练成本砍半、推理显存暴降，配合字节长度缩放技术，形成“国产低成本+开源”组合，有望加速中小厂商与科研侧落地，缓解算力卡脖子焦虑。

2024-12-31

字节 1.58-bit FLUX 模型内存降 7.7 倍性能反增，Will 小哥 GPT-3 20MB 训练法算力省 97%，标志着低精度训练与推理从论文走向可用，将重塑端侧与云端成本结构。

2024-09-16

上交大与哈佛联合推出LoRA-Dash微调框架，针对特定任务方向优化低秩适配，显存与算力需求较LoRA再降30%以上，在Code、Math、MedQA等基准上取得SOTA，为中小企业和边缘端模型定制提供新工具。

2024-07-10

DeepMind JEST、谷歌百万专家及智源 Triton 算子库等方法，将训练时间缩短 13 倍、算力降低 90%，缓解万亿参数时代 GPU 饥渴，为中小团队参与大模型竞争打开窗口。

AI快开门