AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
开源基准
相关话题
2026-02-21
代码模型评测革新
北航开源Code2Bench,用“双扩展”动态题库破解代码大模型刷榜顽疾,推动评测从静态基准走向持续对抗,有望提升社区对模型真实编程能力的信任度。
代码大模型
动态评测
开源基准
ICLR