2025-09-18
大模型科研突破与Nature封面
DeepSeek-R1成为首篇登上《Nature》封面的国产大模型论文,训练成本仅29.4万美元,通过强化学习实现高效推理,标志着中国大模型研究获得国际顶级学术认可,为低成本高性能模型树立新标杆。
2025-07-11
模型架构与训练新范式
北大/华为开源纯卷积DiC,速度超DiT 5倍;Inception Labs推扩散式语言模型Mercury,写代码快10倍;上交团队凭DeepSeek-R1外挂刷新“人类最后考试”国内纪录。后Transformer创新进入爆发期,训练效率与推理质量双升。
2025-06-18
编程模型争霸升级
DeepSeek-R1-0528、Kimi-Dev、Gemini 2.5 Flash等最新编程专用模型在公开评测中轮番登顶,击败Claude 4 Opus,开源与闭源差距迅速缩小,预示“代码智能体”将成为开发者标配,加速软件自动化生产。
2025-05-31
国产开源大模型集体爆发
DeepSeek-R1-0528、通义VRAG-RL、华为昇腾MoE等国产模型密集升级或开源,数学、推理、多模态、训练效率全面对标o3/Gemini 2.5 Pro,形成“无需GPU的国产闭环”,标志着中国大模型进入第一梯队,全球开源生态格局被重写。
2025-04-28
国产大模型密集上新
阿里云Qwen3、字节PHD-Transformer、阶跃Step1X-Edit、DeepSeek-R1T等国产大模型本周集中发布,覆盖语言、多模态、推理、图像编辑等方向,显示国内在基础模型层面的迭代速度已迈入周级,对全球开源生态与产业落地形成持续冲击。
2025-03-22
国产大模型密集上新
腾讯混元发布深度思考模型T1,DeepSeek-R1持续引发评测与治理讨论,国产大模型在性能、开放策略及行业应用上全面加速,标志着国内基础模型进入“多线并进”阶段,对全球竞争格局产生实质冲击。
2025-03-17
国产大模型密集上新
百度文心4.5/X1、阿里「T项目」、DeepSeek-R1等国产大模型集中发布或升级,性能对标国际旗舰,价格腰斩甚至免费,带动钉钉、搜狗输入法、可灵AI等生态应用快速接入,标志国产基础模型进入规模化落地阶段。
2025-03-06
开源轻量推理模型大战
阿里通义千问开源QwQ-32B,以1/10成本实现对标DeepSeek-R1的推理性能,消费级显卡可跑;360、Light-R1等跟进,掀起“小参数+强化学习”复现o1/R1热潮,显著降低大模型落地门槛,加速端侧与中小企业部署。
2025-03-05
推理大模型军备竞赛
DeepSeek-R1、OpenAI o3/o1、Anthropic Claude-3.7-Sonnet、xAI Grok-3等顶尖推理模型密集发布,竞技场排名瞬息变化;开源社区同步推出INT8量化、CoE内存优化、VFMGL多模态迁移等配套技术,标志着“长思维链+强化学习”成为头部厂商必争高地,直接决定下一代AI基础设施格局。
2025-03-03
DeepSeek生态全面爆发
DeepSeek-R1被中信特钢、阿里国际站Accio、腾讯元宝、字节Trae等20余款产品接入,并启动开源周释放推理优化系统,形成低成本、高智商的国产开源生态,倒逼全球模型降价。
2025-02-16
DeepSeek生态爆发
DeepSeek-R1模型发布引发连锁反应:官方同步部署指南、微信灰度接入14亿用户、Perplexity基于R1推出免费Deep Research、英伟达示范测试时Scaling自动优化GPU内核,显示其已成为现象级基础设施,重塑大模型竞争与创业投资格局。
2025-02-11
DeepSeek生态爆发
国产大模型DeepSeek-R1在超算、运营商、手机、音乐、搜索、教育等场景集中落地,开源数据与API同步放出,标志中国大模型首次形成端到端生态闭环,成本骤降90%以上引发全球重估AI算力需求。
2025-02-03
DeepSeek生态爆发
春节前后,DeepSeek-R1/V3系列以开源+低价+国产算力适配快速出圈,华为云、硅基流动、腾讯云等同步上线推理服务,形成从模型、云到端的全栈生态,带动国产大模型首次在全球舆论场与OpenAI正面抗衡,被视为中国AI基础设施的“安卓时刻”。
2025-02-02
DeepSeek冲击波
中国团队DeepSeek-R1以低成本高性能突袭全球,微软、英伟达、亚马逊火速接入,OpenAI紧急降价上线o3-mini应对,并罕见反思“开源错误”。事件标志中国大模型首次在技术与商业层面同时撼动硅谷格局,引发知识产权、芯片管制等连锁议题,被视为全球AI权力转移的里程碑。
2025-01-26
国产开源大模型崛起
DeepSeek-R1、Mini-InternVL 等国产开源模型以低成本、高性能冲击硅谷,引发 Meta 等巨头追加算力军备竞赛,标志中国大模型进入全球第一梯队,重塑行业竞争格局。
2025-01-22
国产大模型密集升级
字节豆包1.5 Pro、网易子曰-o1、DeepSeek-R1等国产模型在推理、多模态、长上下文等维度集体突破,部分指标超越GPT-4o与Claude3.5,并同步开源权重,标志中国大模型进入“可用+可控”新阶段。
2025-01-21
国产开源大模型爆发
DeepSeek-R1、Kimi k1.5、月之暗面K1.5等国产模型相继开源,性能对标OpenAI o1,成本骤降90%,标志中国大模型进入“性能+性价比”双拐点,加速AI平权与全球竞争。
2024-11-21
国产大模型技术突破
阶跃星辰Step-2、百度文心智能体、DeepSeek-R1-Lite等国产大模型在权威榜单或推理能力上对标甚至超越GPT-4o、OpenAI o1,显示中国在万亿参数训练与推理优化上的集体跃迁,重塑全球模型竞争格局。