AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
编译优化
相关话题
2025-06-21
大模型训练与RL新策略
清华&阿里发现“少量高熵tokens”决定大模型推理方向,提出高效RL训练新策略;智源推出Absolute Zero,无需人工数据、自主生成任务提升推理;CMU等将LLM编译成单内核降延迟6.7倍,显示后训练与编译优化正成为性能提升主战场。
强化学习
高熵tokens
Zero-data
编译优化