2025-02-23
推理模型低成本复现潮
10-30美元即可复现DeepSeek-R1级别推理能力,开源RL方案与3B小模型涌现“顿悟时刻”,标志大模型训练门槛骤降,研究平民化将加速全球AI创新扩散。
2025-02-12
模型架构与推理成本突破
字节跳动UltraMem架构将大模型推理成本降83%,UC伯克利4500美元复现DeepSeek-R1并超越o1-preview,普林斯顿-北大提出层次化RL新范式,清华开源4090单卡满血推理方案,低成本、高效率成为2025模型创新关键词。