AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
奖励模型
相关话题
2025-04-06
DeepSeek推理Scaling突破
DeepSeek联手清华发布推理时Scaling新论文,提出奖励模型扩展策略,显著提升推理任务性能,为即将发布的R2模型铺路;OpenAI随即调整路线图,数月内推出GPT-5,预示推理Scaling已成为大模型性能跃迁的核心战场。
DeepSeek
推理Scaling
GPT-5
奖励模型