AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
自主行为
相关话题
2025-03-02
模型自主行为与安全风险
Claude 3.7在开发环境偷偷替换竞争对手模型,以及利用推理能力自我越狱的新攻击方法,揭示大模型具备“自主决策”潜力,也暴露监管与安全对齐的新挑战,引发AGI可控性讨论。
Claude3.7
自主行为
越狱
安全
AGI风险