2025-10-27
开源模型性能里程碑
上海AI Lab 235B开源模型在国际物理奥赛IPhO夺金,击败GPT-5与Grok-4;MiniMax开源M2代码/代理模型,成本仅为竞品8%;月之暗面开源Kimi CLI,命令行+Agent双模切换;美团LongCat-Video开源即SOTA,开源阵营在科学竞赛、编程、视频生成等多任务上首次实现“性能+性价比”双重领先。
2025-10-10
国产大模型与端侧AI突破
vivo发布3B端侧大模型超越8B性能,蚂蚁开源万亿参数Ling-1T,美图RoboNeo月活破百万,面壁智能获北京国资融资并落地汽车手机场景,显示国产模型在参数效率、端侧部署和商业化落地上全面提速,重塑本土AI生态。
2025-07-16
顶级模型迭代与开源竞速
Kimi-2在LiveBench超越GPT-4.1,字节Seed开源POLARIS让4B模型逼近235B数学性能,Mistral发布开源音频Voxtral。国产与海外模型交替刷榜,开源生态加速缩小与闭源差距,降低行业门槛。
2025-05-08
顶级模型密集发布
谷歌Gemini 2.5 Pro、Mistral Medium 3、阶跃星辰多模态大模型等相继升级或开源,性能对标GPT-4o、Claude 3.7,成本下降一个量级,标志基础模型进入“性能-成本”双优阶段,直接重塑开发者选型与下游应用落地节奏。
2025-04-01
顶级模型发布与开源
OpenAI、谷歌、智谱等密集发布新一代大模型:OpenAI计划开源带推理能力的模型,Gemini 2.5 Pro IQ达130、数学超越研究生,智谱AutoGLM实现“边想边干”。开源与性能双突破,标志行业进入“推理+Agent”新阶段,将重塑开发者生态与商业落地节奏。
2025-03-27
谷歌Gemini 2.5 Pro登顶
谷歌深夜发布Gemini 2.5 Pro实验版,首次在LMArena榜单以40分优势超越GPT-4.5,代码、数学、推理全面屠榜,开启“思考模型”新范式;DeepSeek-V3-0324仅用后训练优化即实现同等超越,开源与闭源旗舰同频竞争,大模型性能天花板再被抬高。
2025-01-01
开源模型突破与国产DeepSeek V3夺冠
DeepSeek V3在Chatbot Arena闯入总榜前十并获“最强开源”认证,多项基准反超Claude 3.5 Sonnet,显示国产开源大模型已具备与闭源旗舰正面对抗的硬实力,将加速社区二次开发与全球生态竞争。
2024-10-17
顶级大模型密集发布
英伟达开源70B Nemotron、Meta Dualformer、零一万物Yi-Lightning、Mistral Ministral系列等旗舰模型集中亮相,多项基准逼近或超越GPT-4,标志着开源与闭源模型性能差距快速收敛,全球大模型竞赛进入多极化阶段。
2024-05-30
大模型开源与性能突破
Mistral、阿里、腾讯等密集发布开源或高性能大模型:Mistral 22B代码模型秒级推理击败Llama3-70B,阿里云LucaOne开源对标AlphaFold3,腾讯「元宝」App落地,MoE架构以1/19算力逼近Llama3,显著降低训练与推理成本,推动大模型进入普惠与实用阶段。