AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
GDPO
相关话题
2026-01-11
大模型训练安全与优化新进展
港大在TPAMI揭示梯度反转攻击可高效窃取联邦学习隐私,英伟达提出GDPO算法解决多奖励对齐难题,Sakana引入“AI猎杀”进化策略,共同指向2025年大模型训练的安全、对齐与自动化优化三大前沿方向。
联邦学习
梯度攻击
多奖励对齐
GDPO
AI进化