AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
训练策略
相关话题
2024-12-21
合成数据与训练新范式
微软Phi-4预训练采用40%合成数据,14B参数模型逼近70B效果;DeepMind提出逆向思维微调提升LLM推理能力,显示高质量合成数据与新型训练策略正成为突破Scaling Law的重要方向。
合成数据
Phi-4
逆向思维
训练策略
ScalingLaw