AI快开门

发现最好的AI工具

2024-04-05

大模型安全与对齐风险

CodeAttack红队框架揭示大模型安全对齐在代码环境泛化失败,薛澜指出AI治理面临隐私、道德与国际合作多重挑战,凸显随着模型能力跃升,安全与治理研究亟需同步加速。