AI快开门

发现最好的AI工具

2024-12-21

合成数据与训练新范式

微软Phi-4预训练采用40%合成数据,14B参数模型逼近70B效果;DeepMind提出逆向思维微调提升LLM推理能力,显示高质量合成数据与新型训练策略正成为突破Scaling Law的重要方向。