2026-02-15
模型安全攻防升级
Gemini遭遇单次超10万次提示的“蒸馏攻击”导致核心逻辑泄露,同时新研究把Agent防御延迟从200%降至8.3%,大模型进入“攻与防”军备竞赛,安全能力将直接影响商业可用性。
2024-10-09
AI安全与创作者保护
Adobe推出免费“内容真实性”应用、新加坡将AI课程纳入中小学必修课、国内启动首个大模型攻防赛,显示行业从能力竞赛转向可信、合规与人才前置培养。
2024-06-12
模型安全与越狱攻防升级
北航&南洋理工万轮测试证实GPT-4o越狱率显著高于GPT-4V,国内团队同步推出多模态安全基准,显示GPT-4o仅65.5%准确率,模型能力越强伴随安全代价,行业呼吁同步强化对齐与评测体系。