Agent治理 - AI话题 - AI快开门

2026-05-10

大模型安全与治理框架升级

港中文开源ArbiterOS运行时治理系统、智源发布FlagSafe红蓝白一体化安全平台、浙大提出NCB指标检测模型信念稳定性，共同指向“能力越强、治理越前置”的行业共识，为高敏感场景落地提供可复用的安全底座与评测标准。

Agent治理 FlagSafe NCB指标大模型安全运行时拦截

2025-03-30

多模态与Agent治理热议

GPT-4o生图机制被港中文团队“扒开”，确认原生自回归+可手动编辑；OpenAI闭门会聚焦Agent落地难点，提出对齐-监控-反馈治理框架；OPPO研究院OThink-MR1突破多模态泛化推理，显示多模态与Agent技术仍处快速迭代与规范建立期。

多模态生成 Agent治理泛化推理原生自回归规范建立