2026-03-08

AI安全与评估体系

Claude两周自动挖出火狐22个漏洞含14个高危;187篇论文因“套壳API”数据污染导致准确率暴跌;Anthropic发布劳动力影响新框架,AI评估、安全与可复现性成为学术与产业共同焦点。
2024-05-04

小模型数据污染危机

多项研究指出,微软Phi-3、Mixtral 8x22B等热门小模型存在严重数据污染与过拟合,三分之二评测集被混入训练数据,导致性能虚高,引发社区对小型模型可信度的重新审视。