2025-08-21
超长上下文开源模型大战
字节跳动开源Seed-OSS-36B,512K上下文长度刷新纪录,性能对标DeepSeek;MIT提出TIM架构理论上实现“无限”推理长度,国产Avengers-Pro路由系统以19%成本逼近Gemini-2.5-Pro。超长上下文与高效推理成为开源社区新赛点,直接降低开发者门槛,加速长文档、代码、多模态应用落地。
2025-05-02
超长上下文与高效推理突破
英伟达与UIUC把Llama上下文扩至400万token创SOTA;微软Phi-4系列以小参数量逼近GPT-4o推理表现;LoRA冗余研究称可剪枝95%参数不降性能,推动端侧与低成本部署。
2024-03-12
超长上下文与向量底座升级
清华InfLLM以“外部记忆”零训练实现1024K token 100%召回;零一万物向量数据库Descartes在ANN-Benchmark六项数据集霸榜,领先旧SOTA最高286%。长文本与向量检索两大基础设施同日突破,为大模型落地扫清关键障碍。