AI快开门

发现最好的AI工具

2024-02-14

对齐与安全新思路

开源Samantha项目让智能体在真实人类环境中“成长”,通过实时交互自我更新,以避免后期集中对齐的风险;同时“拒绝回答”型AI走红,提示社区开始用“废柴”方式探索可控性。两类实验表明,对齐不再只是后期微调,而是贯穿训练与使用的动态过程。