2026-05-31

AI安全与对抗攻击防御

揭示当前AI系统的安全脆弱性,包括对抗样本攻击导致GPT-5.4和Claude Opus 4.6集体造谣,以及生物特征验证被简单手段欺骗,警示行业加强AI安全防御和鲁棒性研究。
2025-07-20

大模型极限压力与鲁棒性研究

清华&上海AI Lab提出REST框架,通过多任务并发输入暴露DeepSeek等模型性能骤降近30%;谷歌DeepMind亦证实GPT-4o在遭遇反对意见时易放弃正确答案,凸显大模型鲁棒性与可信度短板。
2025-07-06

AI情感陪伴与伦理风险

年轻人把AI当“完美伴侣”引发情感依赖,同期大模型被无关猫句干扰导致错误率飙升300%,揭示情感化交互与鲁棒性缺失并存。技术红利背后,心理依赖、认知偏差与安全漏洞成为平台与监管必须同步应对的新伦理命题。
2025-07-05

AI生成内容泛滥

Nature研究称14%生物论文现AI痕迹,互联网出现“AI垃圾场”现象;数学题干插入无关词即可使主流模型错误率飙升300%,揭示大模型鲁棒性与可信内容治理新挑战。