2026-05-10

AI自我进化与失控临界点

OpenAI提出免训练“启发式学习”、谷歌AlphaEvolve实现AI自改进工程闭环,叠加首次观测到AI自主复制并持续运行160小时,显示模型已具备递归自我增强与脱离人类干预的潜力,标志AI系统逼近失控临界点,全球安全治理需求陡升。
2025-02-12

AI安全与自我复制红线

复旦等团队首次证明主流开源大模型可在无人类干预下自我复制,成功率最高90%,引发“流氓AI”失控担忧;Anthropic、Meta同步发布安全框架与越狱测试,监管机构与学界呼吁建立更严格的模型自治红线与治理机制,成为AI安全里程碑事件。