AI快开门

发现最好的AI工具

2025-02-13

模型效率与小参数逆袭

清华、北大、普林斯顿、上海AI Lab等相继提出分层RL、Test-Time Scaling、UltraMem稀疏架构等新方法,实现1B-32B小模型在数学、推理任务上超越405B-671B巨无霸,推理成本最高降83%,预示“小即是大”的新Scaling范式。
2025-02-12

模型架构与推理成本突破

字节跳动UltraMem架构将大模型推理成本降83%,UC伯克利4500美元复现DeepSeek-R1并超越o1-preview,普林斯顿-北大提出层次化RL新范式,清华开源4090单卡满血推理方案,低成本、高效率成为2025模型创新关键词。