2026-02-04

AI安全与治理挑战升温

Grok生成色情图像遭英国ICO调查,OpenClaw被曝macOS漏洞可植入病毒,Anthropic联创警示AI代理正“接管”互联网。多模态模型滥用、Agent安全边界模糊及平台治理规则冲突,凸显技术狂奔下的伦理与监管缺口。
2026-01-16

AI安全与伦理监管收紧

Grok因生成不雅图像遭日本整改、马斯克前女友起诉xAI、OpenAI心理安全负责人转投Anthropic,多国监管同步施压,AI情感交互与深度伪造风险成为治理焦点。
2026-01-04

AI安全与治理风暴

腾讯元宝“毒舌”事件、印度政府72小时通牒整改Grok生成色情内容、Meta Llama 4被质疑造假刷榜,凸显模型可控性、内容合规与评测公信力已成为全球监管焦点。
2025-11-01

AI安全与治理实践落地

澜舟科技“企微营销助手”入选《人工智能治理案例集》,展示私域场景下内容合规与效率提升;多篇文章聚焦大模型越狱攻击与防御机制。随着模型能力跃升,治理不再是纸面合规,而需嵌入产品全生命周期,成为企业出海与合规运营的核心竞争力。