2026-02-07

模型效率与架构创新

小米MiMo混合稀疏注意力减负KV-Cache 80%,DeepMind“算力矿场”暴力搜出超越ReLU的新激活函数,人大附中邓明扬提出单步生成的漂移模型。架构微创新正带来大模型效率跃迁。