2026-01-19

具身智能评测与落地

李飞飞World Labs联合光轮智能打造全球首个高保真具身智能评测体系,奇瑞30国落地墨甲机器人,MiniMax设硬件子公司,标志机器人产业从“秀demo”进入“可量化、可规模、可商用”阶段,仿真-评测-量产闭环成型。
2025-02-18

模型评测与基准

OpenAI推出SWE-Lancer真实软件工程基准,多模态新基准让GPT-4o得零分;北大几何模型基于DeepSeek-Coder达IMO金牌水平,刷新国产AI科研上限。