Token优化 - AI话题

2026-05-31

针对大模型部署成本高、推理效率低的问题，MIT注意力匹配技术实现内存暴降50倍，抽象符号替代思维链压缩成本11倍，以及数据质量优化策略，为模型轻量化部署和高效推理提供关键技术路径。

2026-04-19

2026关键词“Harness”走红：MiniMax成开源Agent默认后端，易鑫金融Agent单任务16小时token≤50k，效率提升150%。模型+Harness双轮驱动，标志AI进入“深度工程化”落地新阶段。

AI快开门