2025-02-13
模型效率与小参数逆袭
清华、北大、普林斯顿、上海AI Lab等相继提出分层RL、Test-Time Scaling、UltraMem稀疏架构等新方法,实现1B-32B小模型在数学、推理任务上超越405B-671B巨无霸,推理成本最高降83%,预示“小即是大”的新Scaling范式。
2025-02-12
模型架构与推理成本突破
字节跳动UltraMem架构将大模型推理成本降83%,UC伯克利4500美元复现DeepSeek-R1并超越o1-preview,普林斯顿-北大提出层次化RL新范式,清华开源4090单卡满血推理方案,低成本、高效率成为2025模型创新关键词。