AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
竞技基准
相关话题
2024-04-23
大模型评测与竞技
75万轮一对一PK显示GPT-4仍居榜首,Llama 3位列第五;国内首次48小时大模型极限挑战赛落幕,为模型能力评估提供对抗式新基准,推动评测体系从静态榜单向动态竞技演进。
大模型评测
GPT-4
Llama 3
挑战赛
竞技基准