TurboQuant - AI话题

2026-03-26

谷歌TurboQuant将KV缓存压缩6倍实现模型瘦身而不掉点，引发内存股大跌；苹果同步用知识蒸馏把Gemini浓缩进iPhone端侧，蚂蚁F2LLM-v2以1/10参数横扫MTEB十一项冠军，显示“大模型小型化”正成为性能与成本的新战场。

AI快开门