后门攻击 - AI话题

2025-10-12

Anthropic等机构连续证实，仅需250份恶意文档即可在600M-13B参数模型中植入后门，触发特定短语即可操控输出，后门效果与模型规模无关，暴露预训练数据清洗、供应链安全与开源社区治理的系统性漏洞，引发对LLM安全基线的重估。

AI快开门