AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
Token优化
相关话题
2026-05-31
大模型效率与推理优化
针对大模型部署成本高、推理效率低的问题,MIT注意力匹配技术实现内存暴降50倍,抽象符号替代思维链压缩成本11倍,以及数据质量优化策略,为模型轻量化部署和高效推理提供关键技术路径。
推理优化
注意力机制
思维链压缩
内存效率
Token优化
2026-04-19
Harness架构重塑AI应用
2026关键词“Harness”走红:MiniMax成开源Agent默认后端,易鑫金融Agent单任务16小时token≤50k,效率提升150%。模型+Harness双轮驱动,标志AI进入“深度工程化”落地新阶段。
Harness
MiniMax
金融Agent
工程化
Token优化