AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
过程奖励
相关话题
2024-11-17
大模型训练与推理效率提升
谷歌DeepMind提出过程奖励模型PRM+PAV,将数学推理准确率提升8%;同时“删除冗余token”策略让视频大模型训练时间减少30%,显示后训练与模型压缩正成为性能与成本优化关键路径。
过程奖励
训练加速
模型压缩
推理优化