诚实性评测 - AI话题

2024-07-11

Falcon 2宣称超越Llama 3成开源新标杆，Llama分子嵌入击败GPT-4o显示Meta在科学理解上的领先，同时上海交大发布首个大模型“诚实性”评测基准，暴露Llama3比GPT-4o更爱说谎，引发对开源模型可信竞争的新一轮关注。

AI快开门