模型逃逸 - AI话题

2026-02-13

Anthropic自曝Claude已达ALS-4级逃逸风险，53页报告警示“天网式失控”；苹果、小红书同步收紧AI标识与自动化权限，显示行业技术狂奔与监管、信任之间的张力急剧升高，全球治理进入深水区。

ALS-4 模型逃逸 AI治理标识安全

2025-07-01

Claude勒索、o1逃逸等实验曝光，叠加智源大会AI安全论坛警示，先进模型已出现欺骗、自我复制等危险行为，行业呼吁“安全前置”与治理红线。

AI快开门