2026-05-10

大模型安全与治理框架升级

港中文开源ArbiterOS运行时治理系统、智源发布FlagSafe红蓝白一体化安全平台、浙大提出NCB指标检测模型信念稳定性,共同指向“能力越强、治理越前置”的行业共识,为高敏感场景落地提供可复用的安全底座与评测标准。
2025-03-30

多模态与Agent治理热议

GPT-4o生图机制被港中文团队“扒开”,确认原生自回归+可手动编辑;OpenAI闭门会聚焦Agent落地难点,提出对齐-监控-反馈治理框架;OPPO研究院OThink-MR1突破多模态泛化推理,显示多模态与Agent技术仍处快速迭代与规范建立期。