DeepSeek-R1 - AI话题

2025-09-18

大模型科研突破与Nature封面

DeepSeek-R1成为首篇登上《Nature》封面的国产大模型论文，训练成本仅29.4万美元，通过强化学习实现高效推理，标志着中国大模型研究获得国际顶级学术认可，为低成本高性能模型树立新标杆。

2025-07-11

模型架构与训练新范式

北大/华为开源纯卷积DiC，速度超DiT 5倍；Inception Labs推扩散式语言模型Mercury，写代码快10倍；上交团队凭DeepSeek-R1外挂刷新“人类最后考试”国内纪录。后Transformer创新进入爆发期，训练效率与推理质量双升。

DiC 扩散模型 DeepSeek-R1 架构创新训练效率

2025-06-18

编程模型争霸升级

DeepSeek-R1-0528、Kimi-Dev、Gemini 2.5 Flash等最新编程专用模型在公开评测中轮番登顶，击败Claude 4 Opus，开源与闭源差距迅速缩小，预示“代码智能体”将成为开发者标配，加速软件自动化生产。

编程大模型 DeepSeek-R1 Kimi-Dev 代码生成竞技场

2025-05-31

国产开源大模型集体爆发

DeepSeek-R1-0528、通义VRAG-RL、华为昇腾MoE等国产模型密集升级或开源，数学、推理、多模态、训练效率全面对标o3/Gemini 2.5 Pro，形成“无需GPU的国产闭环”，标志着中国大模型进入第一梯队，全球开源生态格局被重写。

DeepSeek-R1 开源国产算力昇腾通义

2025-04-28

国产大模型密集上新

阿里云Qwen3、字节PHD-Transformer、阶跃Step1X-Edit、DeepSeek-R1T等国产大模型本周集中发布，覆盖语言、多模态、推理、图像编辑等方向，显示国内在基础模型层面的迭代速度已迈入周级，对全球开源生态与产业落地形成持续冲击。

Qwen3 PHD-Transformer Step1X-Edit DeepSeek-R1T 国产大模型

2025-03-22

国产大模型密集上新

腾讯混元发布深度思考模型T1，DeepSeek-R1持续引发评测与治理讨论，国产大模型在性能、开放策略及行业应用上全面加速，标志着国内基础模型进入“多线并进”阶段，对全球竞争格局产生实质冲击。

腾讯混元T1 DeepSeek-R1 国产大模型 API评测模型治理

2025-03-17

国产大模型密集上新

百度文心4.5/X1、阿里「T项目」、DeepSeek-R1等国产大模型集中发布或升级，性能对标国际旗舰，价格腰斩甚至免费，带动钉钉、搜狗输入法、可灵AI等生态应用快速接入，标志国产基础模型进入规模化落地阶段。

文心4.5 DeepSeek-R1 腾讯混元基础模型国产升级

2025-03-06

开源轻量推理模型大战

阿里通义千问开源QwQ-32B，以1/10成本实现对标DeepSeek-R1的推理性能，消费级显卡可跑；360、Light-R1等跟进，掀起“小参数+强化学习”复现o1/R1热潮，显著降低大模型落地门槛，加速端侧与中小企业部署。

QwQ-32B DeepSeek-R1 开源推理模型轻量化

2025-03-05

推理大模型军备竞赛

DeepSeek-R1、OpenAI o3/o1、Anthropic Claude-3.7-Sonnet、xAI Grok-3等顶尖推理模型密集发布，竞技场排名瞬息变化；开源社区同步推出INT8量化、CoE内存优化、VFMGL多模态迁移等配套技术，标志着“长思维链+强化学习”成为头部厂商必争高地，直接决定下一代AI基础设施格局。

推理模型 DeepSeek-R1 Claude-3.7 Grok-3 长思维链

2025-03-03