AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
可读性
相关话题
2024-07-19
AI 安全与越狱攻防
研究者发现“过去式”提示词可绕过 GPT-4o 等六大模型安全限制,OpenAI 超级对齐团队提出“证明者-验证者”博弈提升模型输出可读性与可验证性,凸显大模型在安全性、可解释性及对齐方面的持续挑战与前沿探索。
模型越狱
超级对齐
提示攻击
安全对齐
可读性