AI快开门

发现最好的AI工具

2025-01-30

对齐方法创新

TeleAI在ICLR 2025提出好奇心驱动的探索对齐方法,让8B模型在多项任务上超越70B,展示小模型通过强化探索机制实现越级性能的新思路。