泛化风险 - AI话题

2024-04-05

CodeAttack红队框架揭示大模型安全对齐在代码环境泛化失败，薛澜指出AI治理面临隐私、道德与国际合作多重挑战，凸显随着模型能力跃升，安全与治理研究亟需同步加速。

安全对齐红队测试 AI治理泛化风险

AI快开门