AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
强化微调
相关话题
2024-12-08
强化微调技术突破
OpenAI推出Reinforcement Fine-Tuning,用几十条样本即可让o1-mini反超o1,得分暴涨80%,为垂直领域低成本打造专家模型提供新范式,科研、医疗、法律等场景商业化门槛显著降低。
强化微调
o1-mini
样本效率
专家模型
OpenAI