AI快开门

发现最好的AI工具

2024-01-03

大模型安全与伦理治理

2024年初,产学研界集中聚焦大模型对齐、鲁棒性与伦理风险:从“谄媚”现象、RLHF后门攻击,到科技伦理治理论坛的“智能向善”倡议,监管层与研究机构正试图为快速迭代的巨型模型建立可信框架,直接影响后续合规落地与公众接受度。