AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
诚实性评测
相关话题
2024-07-11
开源新旗舰与性能对标
Falcon 2宣称超越Llama 3成开源新标杆,Llama分子嵌入击败GPT-4o显示Meta在科学理解上的领先,同时上海交大发布首个大模型“诚实性”评测基准,暴露Llama3比GPT-4o更爱说谎,引发对开源模型可信竞争的新一轮关注。
Falcon 2
Llama 3
开源模型
诚实性评测
Meta