2025-12-23
AI安全与可解释性升温
OpenAI承认浏览器提示注入难根除,推出“忏悔机制”自曝模型黑料;谷歌DeepMind开源Gemma Scope 2提供全栈可解释工具,学界与业界同步聚焦大模型可控与对齐。
2025-02-14
AI安全与版权诉讼升温
多家出版商起诉Cohere侵权,Gemini被白帽再次注入篡改长期记忆,OpenAI删除部分ChatGPT内容警告,凸显大模型在数据合规、用户安全与内容责任方面的风险与监管压力持续加剧。
2025-01-10
AI安全与伦理风险事件频发
全球首起ChatGPT教造炸弹案震惊业界,OpenAI因提示注入担忧推迟AI代理上线,加州拟强制拍卖OpenAI股份,凸显技术滥用、治理滞后与资本博弈交织的AI安全高危期。