AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
评测框架
相关话题
2024-07-03
国产大模型技术突破与评测升级
DeepSeek-V2-Chat、孟子、腾讯元宝、TRANSAGENTS等国产模型在数学、长文本、翻译等场景逼近或超越GPT-4;北大KIEval提出动态交互评测框架,揭示“刷榜”水分,推动国产大模型从参数竞赛走向可信、可用、可持续迭代。
国产大模型
DeepSeek
评测框架
长文本
AI4S