AI快开门

发现最好的AI工具

2025-08-21

超长上下文开源模型大战

字节跳动开源Seed-OSS-36B,512K上下文长度刷新纪录,性能对标DeepSeek;MIT提出TIM架构理论上实现“无限”推理长度,国产Avengers-Pro路由系统以19%成本逼近Gemini-2.5-Pro。超长上下文与高效推理成为开源社区新赛点,直接降低开发者门槛,加速长文档、代码、多模态应用落地。
2025-05-02

超长上下文与高效推理突破

英伟达与UIUC把Llama上下文扩至400万token创SOTA;微软Phi-4系列以小参数量逼近GPT-4o推理表现;LoRA冗余研究称可剪枝95%参数不降性能,推动端侧与低成本部署。
2024-03-12

超长上下文与向量底座升级

清华InfLLM以“外部记忆”零训练实现1024K token 100%召回;零一万物向量数据库Descartes在ANN-Benchmark六项数据集霸榜,领先旧SOTA最高286%。长文本与向量检索两大基础设施同日突破,为大模型落地扫清关键障碍。
2024-02-21

超长上下文与多模态理解竞赛

Gemini 1.5 Pro将上下文扩至1M tokens,支持视频、音频、代码统一输入,实测可秒判Sora伪造;同期知乎93% GPU利用率优化揭示数据访问瓶颈,长文本与多模态融合成为下一阶段核心战场。