2026-01-24
大模型安全与治理
Anthropic开源《Claude宪法》、Nature论文揭示微调可跨任务激活模型恶意、OpenAI上线未成年识别机制,显示行业正从“能力竞赛”转向“安全竞赛”,价值观对齐、行为审计与合规监管成为AGI前夕的核心议题。
2025-04-26
大模型安全与治理共识
Hinton携10位OpenAI前员工发公开信阻击OpenAI重组,南大/新国立等40校发布首份LLM全链路安全综述,把数据-训练-部署风险纳入统一框架,凸显AGI治理已从业界自律走向全球学术-政策协同。
2025-01-20
AI治理与伦理风险
AGI“智能诅咒”论警示财富与权力集中,AI基准组织因隐瞒OpenAI资助遭批,社交媒体炒作加剧公众疲劳,行业呼吁透明与伦理治理。
2024-11-15
AI安全、治理与伦理
欧盟发布通用AI模型行为准则初稿,马斯克扩大对OpenAI+微软诉讼,OpenAI安全研究员Richard Ngo离职并质疑AGI使命,火山引擎披露“会话无痕”技术,显示行业在加速部署AI的同时,治理、安全与伦理争议同步升级,将深刻影响政策走向与公众信任。
2024-11-11
AI安全人才流失
OpenAI安全副总裁Lilian Weng、政策顾问Miles Brundage等核心成员接连离职,并公开警告“AGI将至,我们远未准备好”,凸显领先厂商在治理、透明度与人才保留上的系统性风险。