UltraMem - AI话题 - AI快开门

2025-02-13

清华、北大、普林斯顿、上海AI Lab等相继提出分层RL、Test-Time Scaling、UltraMem稀疏架构等新方法，实现1B-32B小模型在数学、推理任务上超越405B-671B巨无霸，推理成本最高降83%，预示“小即是大”的新Scaling范式。

2025-02-12

字节跳动UltraMem架构将大模型推理成本降83%，UC伯克利4500美元复现DeepSeek-R1并超越o1-preview，普林斯顿-北大提出层次化RL新范式，清华开源4090单卡满血推理方案，低成本、高效率成为2025模型创新关键词。

# UltraMem