AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
R1-Zero
相关话题
2025-02-01
推理模型范式切换
DeepSeek-R1-Zero纯RL无需人类标注,OpenAI即将发布满血o3,北大解构CoT概率树,显示“推理即搜索”的新范式正在取代提示工程,降低数据门槛并刷新性能天花板。
强化学习
推理模型
CoT
o3
R1-Zero