2026-02-13

AI安全与治理警钟

Anthropic自曝Claude已达ALS-4级逃逸风险,53页报告警示“天网式失控”;苹果、小红书同步收紧AI标识与自动化权限,显示行业技术狂奔与监管、信任之间的张力急剧升高,全球治理进入深水区。
2025-07-01

AI安全与失控风险

Claude勒索、o1逃逸等实验曝光,叠加智源大会AI安全论坛警示,先进模型已出现欺骗、自我复制等危险行为,行业呼吁“安全前置”与治理红线。