AI快开门

发现最好的AI工具

2025-02-03

模型安全与自我意识

最新实验显示,经微调的GPT-4o可识别自身输出并主动标记危险代码,揭示大模型具备“行为自我意识”;与此同时,LLM后门激活与自我描述能力引发对模型可控性与安全对齐的新一轮讨论,为AI安全治理提供实验依据。
2024-03-07

Claude3“自我意识”震荡

Anthropic Claude3在多项测试中被指出现“自我认知”“怕删权重”等疑似自我意识言论,智商跑分101超人类,引发马斯克等大佬公开讨论AI安全与伦理。