竞技场 - AI话题 - AI快开门

2026-04-17

谷歌、高德、智平方等集中发布具身大脑/机器人模型，π0.7被称“机器人GPT-3时刻”；18家顶尖团队启动全球最大具身模型竞技场；4.55亿美元中国单笔最大融资注入，技术、资本、赛事三箭齐发，标志具身智能进入规模落地拐点。

2025-06-18

DeepSeek-R1-0528、Kimi-Dev、Gemini 2.5 Flash等最新编程专用模型在公开评测中轮番登顶，击败Claude 4 Opus，开源与闭源差距迅速缩小，预示“代码智能体”将成为开发者标配，加速软件自动化生产。

2025-06-06

谷歌发布Gemini 2.5 Pro预览版，在代码、数学、推理基准上超越o3、Grok 3 Beta等对手，蝉联竞技场榜首；同时谷歌推出Portraits虚拟专家对话功能，显示其多模态与对话能力继续领跑全球闭源模型赛道。

2025-02-28

Claude 3.7 Sonnet登顶编程竞技场，字节Trae免费集成Claude 3.7，谷歌/微软/OpenAI齐推免费代码助手，AI编程进入“零门槛”时代，开发者效率再翻倍。

2025-02-07

谷歌密集发布Gemini 2.0 Pro/Flash/Flash-Lite，原生多模态、2M上下文、编程与物理模拟能力刷新SOTA，竞技场霸榜，被视作对DeepSeek与ChatGPT的双线反击。

2025-01-01

DeepSeek V3在Chatbot Arena闯入总榜前十并获“最强开源”认证，多项基准反超Claude 3.5 Sonnet，显示国产开源大模型已具备与闭源旗舰正面对抗的硬实力，将加速社区二次开发与全球生态竞争。

2024-06-20

GPT-4o获AI高考榜眼、大模型竞技场排名引口水战、1342万考生用AI填志愿。高考、志愿、OlympicBench等新基准成为模型“刷榜”新阵地，也反映公众对AI智力水平的高度关注与信任度提升。

2024-04-21

Cohere开源Command R+在LMSYS竞技场一周内击败GPT-4，成为首个登顶的开源大模型，已上线HuggingChat供免费试玩，标志着开源社区首次在公开评测中超越闭源旗舰，提振了开放研究信心，并可能加速商业应用与生态竞争。

开源 Command R+ GPT-4 LLM竞技场

# 竞技场