2026-02-14

AI安全与治理升级

OpenAI停用GPT-4o旧版并上线提示注入防护、ChatGPT新增锁定模式,国务院专题学习“人工智能+”,央企被要求突破大模型核心技术,政策与厂商同步强化AI安全与合规,为大规模落地铺路。
2024-07-16

AI安全与全球治理新规

2024世界人工智能大会发布《上海宣言》及《全球人工智能治理与中国方案》,欧盟同步追加5亿欧元扶持GenAI并强化监管;OpenAI被举报用保密协议限制员工披露风险;姚期智等呼吁为超大型模型立规,显示政策层面对AI安全与治理的关注度急剧升温。
2024-04-03

长上下文安全与评测新方法

Anthropic、斯坦福与腾讯相继曝光“长上下文越狱”风险:Claude、GPT-4、Llama-2在长提示下均被诱导泄露敏感信息;腾讯提出“数星星”评测法替代“大海捞针”,更精准衡量模型长依赖能力。长文本既是产品卖点也是安全软肋,催生新的评测与防护标准,将直接影响大模型商业可信度和合规节奏。