2026-04-22
长上下文与模型效率突破
DeepSeek API升级至百万Token上下文,蚂蚁百灵发布104B参数却仅激活7.4B的Ling-2.6-flash,兼顾性能与成本,显示国产大模型在“长记忆”与“高效推理”两端同步取得关键进展,为复杂任务落地扫清障碍。
2026-04-13
终端智能体爆发:荣耀YOYO Claw引领
荣耀发布预制“龙虾”AI智能体YOYO Claw,出厂内置23子Agent,Token消耗降50%,首次落地MagicBook并开放豆包手机深度整合。终端侧Agent从“语音助手”进化为“系统级自动化引擎”,标志手机、PC进入“免安装、免提示”的原生智能体时代。
2026-03-18
后Scaling时代模型效率革命
OpenAI、MiniMax、月之暗面等密集发布轻量化或自迭代模型,标志行业从堆算力转向拼Token效率与自我进化,降低门槛并加速落地。
2025-11-02
长文本高效处理突破
南理工等高校联合提出VIST框架,用“视觉中心化”思路把长文本当图像压缩,内存占用降50%、token用量减56%,在NeurIPS 2025获选。该方法为长文档理解、法律/医疗文本处理等高价值场景提供可扩展、低成本的全新技术路线。