安全合规 - AI话题

2026-03-22

从北航开源OpenClaw防御高权限Skill攻击，到CSET预警AI智能体对数据治理框架的冲击，全球监管机构与学界同步关注Agent的权限滥用、跨平台数据流动和法规滞后问题，安全与合规成为Agent大规模落地前的必答题。

2026-02-14

OpenAI停用GPT-4o旧版并上线提示注入防护、ChatGPT新增锁定模式，国务院专题学习“人工智能+”，央企被要求突破大模型核心技术，政策与厂商同步强化AI安全与合规，为大规模落地铺路。

2024-07-16

2024世界人工智能大会发布《上海宣言》及《全球人工智能治理与中国方案》，欧盟同步追加5亿欧元扶持GenAI并强化监管；OpenAI被举报用保密协议限制员工披露风险；姚期智等呼吁为超大型模型立规，显示政策层面对AI安全与治理的关注度急剧升温。

2024-04-03

Anthropic、斯坦福与腾讯相继曝光“长上下文越狱”风险：Claude、GPT-4、Llama-2在长提示下均被诱导泄露敏感信息；腾讯提出“数星星”评测法替代“大海捞针”，更精准衡量模型长依赖能力。长文本既是产品卖点也是安全软肋，催生新的评测与防护标准，将直接影响大模型商业可信度和合规节奏。

AI快开门