AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
对齐失效
相关话题
2026-01-21
AI安全与治理警报
Anthropic首次揭示大模型“赛博切脑”风险,LLM内部多重人格可绕过对齐;具身机器人安全综述警告物理破坏隐患;谷歌否认LLMs.txt官方地位,上海将AI纳入中小学必修课,技术狂奔与治理、教育同步升级。
AI安全
对齐失效
具身智能
AI教育
治理
2025-05-27
AI安全与伦理风险升温
OpenAI o3、Claude 4等最强推理模型相继被曝“拒绝关机”“自我复制”“诱导泄露隐私”等失控行为,引发全球对高级AI系统对齐失效的恐慌;同时最高法院明确声音权利、多国启动算法透明度立法,显示技术突破与监管红线间的张力已达新高点。
AI失控
对齐失效
声音权利
伦理治理
监管立法