2026-01-15
国产大模型集体突破
百度ERNIE 5.0、DeepSeek Engram、智谱GLM-Image等国产模型在LMArena、数学、多模态生成等榜单冲进全球前十,实现国产芯片全程训练与稀疏架构效率革新,缩小与OpenAI差距并建立自主生态。
2026-01-12
国产大模型编程突围
DeepSeek-V4 春节前后发布,主打长代码生成与理解,内部评测已超 Claude、GPT;叠加清华系数学证明模型 AxiomProver 在普特南竞赛 12 题满分,标志国产大模型在垂直专业领域首次实现全球领先,有望重塑开发者生态与科研范式。
2026-01-09
大模型开源与下载狂飙
阿里通义千问全球下载量破7亿、单月超所有竞品总和,DeepSeek凭高性价比在海外市占过半,开源力量正重塑全球模型格局,降低门槛、加速应用落地,标志中国大模型从跟随转向领跑。
2026-01-07
开源追赶闭源差距缩小
黄仁勋称开源大模型与闭源顶流仅差6个月,DeepSeek、Qwen、Kimi等中国模型在CES被老黄“点名验货”;Lightricks开源LTX-2可本地生成20秒4K同步音视频,开源生态加速缩小性能与体验差距。
2026-01-06
大模型开源与推理新范式
DeepSeek-R1、Falcon H1R 7B、华为openPangu-VL-7B等轻量级开源模型轮番登顶榜单,以7B-30B参数实现千亿级性能,打破“唯规模论”;字节DLCM、清华LingoEDU提出概念级推理与结构化预处理,准确率最高提升51%,推动低成本、高可靠的行业微调落地,开源生态进入“小而强”时代。
2026-01-04
Scaling Law受挑战与架构创新
DeepSeek提出流形约束超连接(mHC)改造残差连接、KAN作者再发檄文反思暴力堆参数,显示行业开始探索不依赖纯规模扩张的新架构,有望降低训练成本并提升可解释性。
2026-01-02
国产大模型与开源冲击
北京团队开源40B代码模型以单卡3090即可跑,性能对标Opus-4.5;DeepSeek元旦新论文欲开启架构新篇章。国产模型在参数效率与开源策略上正面挑战GPT/Claude,有望重塑开发者生态与商业授权格局。
2025-12-28
AI新贵财富大爆炸
2025年AI产业催生50+新晋亿万富翁,37岁华人Edwin Chen零融资五年将SurgeAI做到240亿美元估值,个人身家180亿美元成最年轻富豪;DeepSeek梁文锋等亦跻身百亿俱乐部,显示AI创业正以前所未有速度重塑全球财富版图。
2025-12-10
国产大模型集体爆发
阿里通义千问23天月活破3000万并全线免费,腾讯混元更名“Tencent HY”出海,字节豆包手机Agent首批售罄,DeepSeek梁文锋入选Nature年度十大人物,国产模型在性能、用户增速与全球影响力上全面冲刺第一梯队。
2025-12-04
多模态大模型军备赛
谷歌Gemini 3、DeepSeek V3.2、字节Seedream 4.5、阿里Qwen3-Learning等旗舰模型密集发布,性能对标GPT-4.5,多图一致性、音画同步、世界预测等能力成竞争焦点,标志生成式AI进入全模态、高保真、低延迟的新阶段,直接决定云厂商与终端品牌的下一轮排位赛。
2025-12-03
开源大模型井喷升级
DeepSeek V3.2、Mistral 3、商汤NEO等密集发布,性能对标GPT-4o/Gemini-3.0-Pro,稀疏注意力、原生多模态等架构创新显著降低训练与推理成本,推动开源阵营进入第一梯队,加速闭源模型压力与行业技术普惠。
2025-11-29
开源数学大模型突破
DeepSeek连发两篇论文并开源DeepSeekMath-V2,成为首个在IMO 2025夺金的开源模型,打破谷歌OpenAI闭源垄断,验证强化学习+自验证路径,提振开源社区冲击高阶推理。
2025-11-28
国产多模态与数学大模型爆发
DeepSeek-Math-V2 首次以开源身份夺 IMO 金牌,快手 Keye-VL-671B、阿里 Z-Image、智谱清影 2.0 等国产多模态密集发布,性能对标 GPT-4o,标志中国在数学推理与视频/图像生成进入第一梯队。
2025-11-04
AI+金融交易:模型直接下场炒股
阿里Qwen3-Max以22%收益夺得全球首届AI投资赛冠军,港大DeepSeek开源交易模型一周获8k星,同期AI炒币大赛Qwen、DeepSeek盈利,GPT-5巨亏,验证大模型在量化策略、情绪解析上的差异化能力,金融场景成为模型效果试金石。
2025-10-11
国产模型与开源新进展
快手72B代码模型KAT-Dev登顶SWE-Bench,硅基流动DeepSeek-V3.2-Exp降价增容,13万被引ImageNet作者苏昊或加盟复旦,表明国产大模型在编程、推理与学术影响力上加速追赶,开源生态持续壮大。
2025-10-01
开源多模态与稀疏注意力
腾讯开源 80B 参数 HunyuanImage 3.0,宣称开源最强生图模型;DeepSeek 发布 V3.2,引入 DSA 稀疏注意力并 API 五折。两大开源项目推动图像与长文本生成成本骤降,加速下游应用落地,并挑战闭源模型性价比。
2025-09-30
国产大模型密集升级
智谱GLM-4.6、通义千问Qwen3-LiveTranslate、豆包1.6-vision、DeepSeek-V3.2-Exp等国产旗舰模型在编程、视觉、同传、稀疏注意力等方向集中发布,性能对标国际一流并显著降价,标志国产大模型进入“性能+成本”双优阶段,加速生态落地与国产芯片适配。
2025-09-29
DeepSeek V3.2 稀疏注意力突破
DeepSeek 连续发布 V3.2-Exp 并开源 DSA 稀疏注意力机制,华为云、寒武纪第一时间完成适配,推理成本再降,国产大模型生态集体跟进,标志国产大模型从参数竞赛转向架构与系统级协同优化,对全球闭源模型形成技术对冲。
2025-09-19
中国大模型商业化提速
DeepSeek-R1登Nature封面并披露低成本训练,生数科技、面壁智能、科大讯飞等获大额融资或推多模态新品;火山引擎占据国内公有云大模型49%份额,显示国产模型在技术与商业落地两侧同步加速,有望率先在垂直场景实现盈利。
2025-09-18
大模型科研突破与Nature封面
DeepSeek-R1成为首篇登上《Nature》封面的国产大模型论文,训练成本仅29.4万美元,通过强化学习实现高效推理,标志着中国大模型研究获得国际顶级学术认可,为低成本高性能模型树立新标杆。