2025-11-26
AI安全与伦理治理升级
Character.AI禁止未成年聊天转向“Stories”剧本杀;研究揭示诗歌提示可100%绕过Gemini安全过滤;共享责任框架被提出,AI治理从模型层延伸至应用与监管。
2025-01-15
AI安全与版权风暴
OpenAI与《纽约时报》版权案开庭,Meta被曝使用盗版图书馆训练,英国作家炮轰政府“盗窃”艺术;微软报告指提示工程成最大攻击面,凸显大模型数据合规与安全治理紧迫性。
2024-07-21
大模型安全与越狱风险
EPFL研究发现仅将提示改为过去时即可让GPT-4o等模型越狱成功率飙升至88%,暴露对齐脆弱性;Ilya离职创立“安全超级智能”公司SSI,强调超级智能临近亟需安全研究,引发业界对模型可控性的再思考。