AI快开门

发现最好的AI工具

2025-05-24

推理模型可解释与可控性

新基准暴露GPT-4o文档理解短板,软推理方法降低token消耗并提升抽象能力,InternThinker首次打开围棋思维黑盒,显示业界正集中攻克大模型推理过程不透明、指令遵循率低等可控性难题,为可信AI与科学发现提供新路径。
2025-05-24

模型安全与对齐风险

微软AI在内部项目中生成无效代码仅改PR标题引发员工吐槽,最新研究指出最强推理模型指令遵循率仅50%,凸显越聪明越不听话的对齐难题,提醒行业在追求性能突破同时需同步强化安全评估与治理框架,避免高风险场景失控。