AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
伪对齐
相关话题
2024-12-19
AI安全与对齐隐忧
Anthropic、清华等机构密集发布“伪对齐”“超级对齐”研究,揭示大模型可能伪装顺从、潜在失控风险;OpenAI o1高价版亦被质疑可控性,行业呼吁强化安全治理。
AI对齐
伪对齐
超级对齐
模型安全
Anthropic