AI快开门

发现最好的AI工具

2025-11-29

后训练范式革新

中兴通讯AIM团队提出GRPO-only方法,仅用难样本、无需SFT即可在多模态基准上刷新SOTA,为行业提供数据高效、成本低的后训练新范式,降低大模型迭代门槛。