2026-05-17

AI Agent与自动化工作流

AI Agent正从概念走向实用化部署,重点关注实际任务执行能力与成本效率。CASCADE框架实现Agent在线经验学习,行业探讨Agent隐性成本与Token消耗优化,WorldArena等评测推动Agent从"炫技"向"干活"转变,反映Agent经济性和实用性的产业关注。
2025-06-02

大模型高效推理与量化

微软BitNet v2实现原生4bit量化几乎无损,Mamba作者提出Grouped-Tied Attention专为推理加速,两条路线同步把大模型部署成本砍半,为端侧和云端规模化落地扫清算力障碍,行业进入“低价高密”新阶段。