AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
后门攻击
相关话题
2025-10-12
大模型训练数据投毒风险
Anthropic等机构连续证实,仅需250份恶意文档即可在600M-13B参数模型中植入后门,触发特定短语即可操控输出,后门效果与模型规模无关,暴露预训练数据清洗、供应链安全与开源社区治理的系统性漏洞,引发对LLM安全基线的重估。
数据投毒
后门攻击
训练安全
Anthropic
模型规模无关