数据污染 - AI话题

2026-03-08

Claude两周自动挖出火狐22个漏洞含14个高危；187篇论文因“套壳API”数据污染导致准确率暴跌；Anthropic发布劳动力影响新框架，AI评估、安全与可复现性成为学术与产业共同焦点。

2024-05-04

多项研究指出，微软Phi-3、Mixtral 8x22B等热门小模型存在严重数据污染与过拟合，三分之二评测集被混入训练数据，导致性能虚高，引发社区对小型模型可信度的重新审视。

AI快开门