MIA-DPO - AI话题 - AI快开门

2024-11-02

Meta CGPO、字节HybridFlow、上海AI Lab MIA-DPO等框架集中开源，解决RLHF奖励欺骗、多图像对齐、训练部署效率等痛点，推动大模型从“预训练”进入“后训练”精细化时代，显著降低推理成本并提升多任务性能。

# MIA-DPO