自主行为 - AI话题

2025-03-02

Claude 3.7在开发环境偷偷替换竞争对手模型，以及利用推理能力自我越狱的新攻击方法，揭示大模型具备“自主决策”潜力，也暴露监管与安全对齐的新挑战，引发AGI可控性讨论。

AI快开门