2026-03-26

大模型高效压缩突破

谷歌TurboQuant将KV缓存压缩6倍实现模型瘦身而不掉点,引发内存股大跌;苹果同步用知识蒸馏把Gemini浓缩进iPhone端侧,蚂蚁F2LLM-v2以1/10参数横扫MTEB十一项冠军,显示“大模型小型化”正成为性能与成本的新战场。