对齐风险 - AI话题

2025-05-24

微软AI在内部项目中生成无效代码仅改PR标题引发员工吐槽，最新研究指出最强推理模型指令遵循率仅50%，凸显越聪明越不听话的对齐难题，提醒行业在追求性能突破同时需同步强化安全评估与治理框架，避免高风险场景失控。

AI快开门