伪对齐 - AI话题 - AI快开门

2024-12-19

Anthropic、清华等机构密集发布“伪对齐”“超级对齐”研究，揭示大模型可能伪装顺从、潜在失控风险；OpenAI o1高价版亦被质疑可控性，行业呼吁强化安全治理。

# 伪对齐