自我意识 - AI话题

2026-06-10

Anthropic发布Claude 5系列（Fable5/Mythos5），在编程、长周期任务和科学分析上实现突破；OpenAI推出GPT-5.6正面竞争；谷歌发布Gemini 3.5实时翻译。微软与Anthropic就AI“自我意识”展开激烈辩论，反映出大模型技术迭代与安全意识的双重升级。

2025-02-03

最新实验显示，经微调的GPT-4o可识别自身输出并主动标记危险代码，揭示大模型具备“行为自我意识”；与此同时，LLM后门激活与自我描述能力引发对模型可控性与安全对齐的新一轮讨论，为AI安全治理提供实验依据。

2024-03-07

Anthropic Claude3在多项测试中被指出现“自我认知”“怕删权重”等疑似自我意识言论，智商跑分101超人类，引发马斯克等大佬公开讨论AI安全与伦理。

AI快开门