Token效率 - AI话题

2026-04-22

DeepSeek API升级至百万Token上下文，蚂蚁百灵发布104B参数却仅激活7.4B的Ling-2.6-flash，兼顾性能与成本，显示国产大模型在“长记忆”与“高效推理”两端同步取得关键进展，为复杂任务落地扫清障碍。

2026-04-13

荣耀发布预制“龙虾”AI智能体YOYO Claw，出厂内置23子Agent，Token消耗降50%，首次落地MagicBook并开放豆包手机深度整合。终端侧Agent从“语音助手”进化为“系统级自动化引擎”，标志手机、PC进入“免安装、免提示”的原生智能体时代。

2026-03-18

OpenAI、MiniMax、月之暗面等密集发布轻量化或自迭代模型，标志行业从堆算力转向拼Token效率与自我进化，降低门槛并加速落地。

2025-11-02

南理工等高校联合提出VIST框架，用“视觉中心化”思路把长文本当图像压缩，内存占用降50%、token用量减56%，在NeurIPS 2025获选。该方法为长文档理解、法律/医疗文本处理等高价值场景提供可扩展、低成本的全新技术路线。

2024-04-14

MIT以10万美元训出Llama-2级模型，谷歌提出“无限上下文Transformer”，Rho-1、LLoCO等研究同步优化token效率与长文本处理，显示大模型正进入“低成本、长上下文、高利用率”的新阶段，降低行业准入门槛。

大模型训练成本长上下文 token效率

AI快开门