GDPO - AI话题 - AI快开门

2026-01-11

港大在TPAMI揭示梯度反转攻击可高效窃取联邦学习隐私，英伟达提出GDPO算法解决多奖励对齐难题，Sakana引入“AI猎杀”进化策略，共同指向2025年大模型训练的安全、对齐与自动化优化三大前沿方向。

# GDPO