AI快开门

发现最好的AI工具

2025-06-18

编程模型争霸升级

DeepSeek-R1-0528、Kimi-Dev、Gemini 2.5 Flash等最新编程专用模型在公开评测中轮番登顶,击败Claude 4 Opus,开源与闭源差距迅速缩小,预示“代码智能体”将成为开发者标配,加速软件自动化生产。
2025-06-06

Gemini 2.5 Pro再夺榜一

谷歌发布Gemini 2.5 Pro预览版,在代码、数学、推理基准上超越o3、Grok 3 Beta等对手,蝉联竞技场榜首;同时谷歌推出Portraits虚拟专家对话功能,显示其多模态与对话能力继续领跑全球闭源模型赛道。
2025-02-28

AI编程工具激战

Claude 3.7 Sonnet登顶编程竞技场,字节Trae免费集成Claude 3.7,谷歌/微软/OpenAI齐推免费代码助手,AI编程进入“零门槛”时代,开发者效率再翻倍。
2025-02-07

Gemini 2.0全家桶反击

谷歌密集发布Gemini 2.0 Pro/Flash/Flash-Lite,原生多模态、2M上下文、编程与物理模拟能力刷新SOTA,竞技场霸榜,被视作对DeepSeek与ChatGPT的双线反击。
2025-01-01

开源模型突破与国产DeepSeek V3夺冠

DeepSeek V3在Chatbot Arena闯入总榜前十并获“最强开源”认证,多项基准反超Claude 3.5 Sonnet,显示国产开源大模型已具备与闭源旗舰正面对抗的硬实力,将加速社区二次开发与全球生态竞争。
2024-06-20

高考与评测新战场

GPT-4o获AI高考榜眼、大模型竞技场排名引口水战、1342万考生用AI填志愿。高考、志愿、OlympicBench等新基准成为模型“刷榜”新阵地,也反映公众对AI智力水平的高度关注与信任度提升。
2024-04-21

开源模型首超GPT-4

Cohere开源Command R+在LMSYS竞技场一周内击败GPT-4,成为首个登顶的开源大模型,已上线HuggingChat供免费试玩,标志着开源社区首次在公开评测中超越闭源旗舰,提振了开放研究信心,并可能加速商业应用与生态竞争。