token效率 - AI话题

2025-11-02

南理工等高校联合提出VIST框架，用“视觉中心化”思路把长文本当图像压缩，内存占用降50%、token用量减56%，在NeurIPS 2025获选。该方法为长文档理解、法律/医疗文本处理等高价值场景提供可扩展、低成本的全新技术路线。

2024-04-14

MIT以10万美元训出Llama-2级模型，谷歌提出“无限上下文Transformer”，Rho-1、LLoCO等研究同步优化token效率与长文本处理，显示大模型正进入“低成本、长上下文、高利用率”的新阶段，降低行业准入门槛。

大模型训练成本长上下文 token效率

AI快开门