AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
评测框架
相关话题
2026-03-24
学术规范与模型评测
高校严控论文AI生成核心观点,NeurIPS限制华为等机构投稿,ReVeL等新评测框架提出,AI科研诚信、评测透明度与公平性成为焦点。
学术规范
NeurIPS
评测框架
AI治理
科研诚信
2024-07-03
国产大模型技术突破与评测升级
DeepSeek-V2-Chat、孟子、腾讯元宝、TRANSAGENTS等国产模型在数学、长文本、翻译等场景逼近或超越GPT-4;北大KIEval提出动态交互评测框架,揭示“刷榜”水分,推动国产大模型从参数竞赛走向可信、可用、可持续迭代。
国产大模型
DeepSeek
评测框架
长文本
AI4S