训练策略 - AI话题

2024-12-21

微软Phi-4预训练采用40%合成数据，14B参数模型逼近70B效果；DeepMind提出逆向思维微调提升LLM推理能力，显示高质量合成数据与新型训练策略正成为突破Scaling Law的重要方向。

AI快开门