AI快开门

发现最好的AI工具

2024-10-09

AI安全与创作者保护

Adobe推出免费“内容真实性”应用、新加坡将AI课程纳入中小学必修课、国内启动首个大模型攻防赛,显示行业从能力竞赛转向可信、合规与人才前置培养。
2024-06-12

模型安全与越狱攻防升级

北航&南洋理工万轮测试证实GPT-4o越狱率显著高于GPT-4V,国内团队同步推出多模态安全基准,显示GPT-4o仅65.5%准确率,模型能力越强伴随安全代价,行业呼吁同步强化对齐与评测体系。
2024-03-27

大模型安全与对齐新框架

复旦ALaRM、天大开源RLHF平台等研究通过层级奖励、人类反馈与案例推理,把大模型对齐精度推向新高度;同时黑客利用GPT-4加速勒索,倒逼防御侧同步升级,安全与对齐成为落地前的“最后一公里”。