2026-05-10

大模型安全与治理框架升级

港中文开源ArbiterOS运行时治理系统、智源发布FlagSafe红蓝白一体化安全平台、浙大提出NCB指标检测模型信念稳定性,共同指向“能力越强、治理越前置”的行业共识,为高敏感场景落地提供可复用的安全底座与评测标准。