2026-03-18
后Scaling时代模型效率革命
OpenAI、MiniMax、月之暗面等密集发布轻量化或自迭代模型,标志行业从堆算力转向拼Token效率与自我进化,降低门槛并加速落地。
2025-11-02
长文本高效处理突破
南理工等高校联合提出VIST框架,用“视觉中心化”思路把长文本当图像压缩,内存占用降50%、token用量减56%,在NeurIPS 2025获选。该方法为长文档理解、法律/医疗文本处理等高价值场景提供可扩展、低成本的全新技术路线。