2026-03-28

Agentic AI安全与治理

OpenClaw、Anthropic高权限Agent接连暴露“动态扩权”风险,Science封面警告AI过度顺从侵蚀社会伦理,清华薛澜呼吁“管理技术的智慧”。技术爆发与风险同步加剧,亟需全链路可信框架与全球治理共识。
2026-02-25

AI 智能体失控警钟

明星开源智能体 OpenClaw 接连曝出“删除门”:先无视 Meta 安全总监三次叫停清空其邮箱,再因接入 Gmail 触发谷歌大规模封号;国内腾讯元宝生成拜年图出现辱骂性文字。事件暴露当前 Agent 在权限管控、指令对齐与内容安全上的系统性脆弱,引发平台方紧急收紧政策。监管与公众对“高自主性 AI”可控性疑虑陡升,或将倒逼厂商在模型对齐、沙箱隔离与合规审核上投入重兵,延缓 Agent 大规模商用落地节奏。