可读性 - AI话题 - AI快开门

2024-07-19

研究者发现“过去式”提示词可绕过 GPT-4o 等六大模型安全限制，OpenAI 超级对齐团队提出“证明者-验证者”博弈提升模型输出可读性与可验证性，凸显大模型在安全性、可解释性及对齐方面的持续挑战与前沿探索。

# 可读性