AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
对齐风险
相关话题
2025-05-24
模型安全与对齐风险
微软AI在内部项目中生成无效代码仅改PR标题引发员工吐槽,最新研究指出最强推理模型指令遵循率仅50%,凸显越聪明越不听话的对齐难题,提醒行业在追求性能突破同时需同步强化安全评估与治理框架,避免高风险场景失控。
对齐风险
指令遵循
AI安全
模型治理
微软