2026-05-31

大模型效率与推理优化

针对大模型部署成本高、推理效率低的问题,MIT注意力匹配技术实现内存暴降50倍,抽象符号替代思维链压缩成本11倍,以及数据质量优化策略,为模型轻量化部署和高效推理提供关键技术路径。
2026-04-19

Harness架构重塑AI应用

2026关键词“Harness”走红:MiniMax成开源Agent默认后端,易鑫金融Agent单任务16小时token≤50k,效率提升150%。模型+Harness双轮驱动,标志AI进入“深度工程化”落地新阶段。