竞技基准 - AI话题

2024-04-23

75万轮一对一PK显示GPT-4仍居榜首，Llama 3位列第五；国内首次48小时大模型极限挑战赛落幕，为模型能力评估提供对抗式新基准，推动评测体系从静态榜单向动态竞技演进。

AI快开门