AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
评测体系
相关话题
2026-01-19
具身智能评测与落地
李飞飞World Labs联合光轮智能打造全球首个高保真具身智能评测体系,奇瑞30国落地墨甲机器人,MiniMax设硬件子公司,标志机器人产业从“秀demo”进入“可量化、可规模、可商用”阶段,仿真-评测-量产闭环成型。
具身智能
评测体系
机器人
仿真
2025-02-18
模型评测与基准
OpenAI推出SWE-Lancer真实软件工程基准,多模态新基准让GPT-4o得零分;北大几何模型基于DeepSeek-Coder达IMO金牌水平,刷新国产AI科研上限。
基准测试
IMO几何
SWE-Lancer
评测体系
科研突破