2026-05-25

模型优化与AI基础设施

面壁智能联合清华发布中国首个1.58-bit大模型BitCPM-CANN,实现低比特训练突破;清华联合腾讯混元获MLSys MoE推理挑战赛冠军,NPU推理提速4.1倍;得州拟建2.5吉瓦核电燃气混合电站应对AI用电激增;EdgeRazor实现解码加速15倍。模型压缩、推理优化与能源基础设施成为AI规模化关键支撑。
2026-05-10

多语言与数据高效模型新路径

南大团队提出ParamΔ+Upcycled MoE组合,仅用少量目标语言数据即可把单语LLM升级为多语大模型,低资源语言性能大幅提升;HiLight框架实现长文原文划重点,减少切片幻觉,共同指向“轻数据、重结构”的模型扩展新方向。
2026-05-04

模型效率与架构创新

中科院瞬悉2.0、DeepSeek Mega MoE及SonicMoE等方案,针对长序列与低功耗场景优化架构,显著降低推理成本,为端侧部署和多模态交互提供高效替代,缓解Transformer规模瓶颈。
2026-03-28

模型架构与训练突破

Anthropic意外泄露“Capybara”新架构全面碾压Opus 4.6,北大提出Frozen Policy迭代算法刷新强化学习样本效率,MoE与ViSNet-PIMA等结构创新持续推高模型性能与科学计算精度,底层技术仍在快速演进。
2026-03-04

开源框架与端侧AI爆发

OpenClaw以25.2万星登顶GitHub历史第一,阶跃星辰开源1960亿MoE模型Step3.5Flash,蚂蚁+清华发布AReaL强化学习框架,理想汽车提出端侧Scaling Law,标志开源生态与端侧部署进入“免训练、一键接入”新阶段,开发者门槛骤降。
2025-11-28

芯片外销与算力基建军备赛

谷歌 2027 年拟向 Meta 外销百万 TPU,创收 130 亿美元;华为开源准万亿 MoE 推理方案,无问芯穹再获 5 亿元融资,云边端软硬协同成为 AI 基础设施竞争焦点,算力商品化加速。
2025-11-25

国产全模态/多模态模型加速开源

昆仑元发布BaiZe-Omni-14b-a2b全模态融合模型;哈深Uni-MoE-2.0-Omni实现文本、图像、音频统一SOTA;腾讯开源1B参数HunyuanOCR刷新多项记录。国产模型以轻量参数、全模态能力、开源策略快速迭代,降低行业落地门槛,对下游应用与开发者生态形成强支撑。
2025-10-30

AI编程工具升级战

Cursor 2.0推出自研Composer模型,8 Agent并行编码速度提升4倍;Lovable 8个月ARR破亿,验证“AI+低代码”商业化路径;编程大模型进入MoE+强化学习新范式,开发者效率迎来“核爆级”升级。
2025-10-26

AI算法自我进化

伯克利ADRS系统让AI 5小时自研MoE训练算法,速度提升5倍、成本降26%,标志算法发现进入“无人区”,科研范式从人类设计转向机器自主迭代,将重塑算力与模型经济。
2025-09-17

编程大模型军备赛

OpenAI连发GPT-5-Codex系列,支持7小时连续编码与动态算力分配;国内蚂蚁开源MoE模型Ling-flash-2.0以6.1B参数比肩40B Dense,Cursor、CodeRabbit等AI编程工具融资与功能迭代加速,行业进入“自动化软件工程”新阶段。
2025-09-12

开源大模型技术突破

阿里Qwen3-Next、字节HuMo、阿里妈妈SDH等多款开源大模型密集发布,MoE与扩散架构成为新主流,训练成本骤降90%,性能逼近GPT-5,标志国产开源进入全球第一梯队,将加速行业落地与生态繁荣。
2025-08-11

算法与算力底层创新

清华团队打破40年Dijkstra最优性神话,新最短路径算法登STOC最佳;谷歌DeepMind Perch 2.0刷新1.5万物种生物声学SOTA;MoE超级专家机制、Kitten 1500万参数TTS等轻量模型涌现,显示底层算法与架构创新仍在加速。
2025-08-07

OpenAI 6年后再开源

OpenAI 时隔六年推出 gpt-oss-20b/120b 两款开源 MoE 模型,性能逼近 o4-mini,Apache 2.0 授权+MXFP4 量化,笔记本可跑;同步流出 GPT-5 四版本路线图,标志其从封闭走向开源生态,牵动全球开发者与竞争格局。
2025-07-24

开源编程模型爆发

阿里Qwen3-Coder、5ire等开源模型刷新代码生成SOTA,支持1M上下文、MoE架构,性能对标Claude 4但成本骤降,引爆“零门槛”AI编程生态,直接冲击闭源商业模型市场。
2025-07-13

国产大模型开源竞速

Kimi发布1T MoE模型K2并同步开源,在代码、Agent、数学基准全线SOTA;人大提出DNA基础模型SPACE,seq2func预测刷新纪录。国产大模型进入“万亿参数+开源”阶段,降低研究门槛,加速垂直领域落地与生态竞争。
2025-07-03

国产大模型开源爆发

华为盘古、智谱GLM、字节VINCIE、B站AniSora等国产大模型密集开源,覆盖MoE、多模态、视频生成等方向,参数规模从3B到72B不等,性能对标国际闭源模型,标志国产AI进入“开源反哺生态”新阶段,显著降低开发者门槛并加速行业落地。
2025-07-01

超大模型新王争霸

Gemini 2.5 Pro、百度文心4.5系列等旗舰模型密集开源或升级,百万级长上下文、MoE架构与多模态能力成为竞逐焦点,直接重塑开发范式与商业落地门槛。
2025-07-01

国产算力与芯片IPO

摩尔线程、沐曦同日获IPO受理,华为开源MoE推理框架,国产GPU进入资本市场与生态建设双加速阶段,为自主大模型提供底层支撑。
2025-06-21

MoE与推理模型新架构

蚂蚁开源轻量级MoE推理框架Ring-lite,月之暗面发布深度研究Agent Kimi-Researcher,李飞飞团队提出“嫁接”预训练组件的新架构设计范式,显示行业在高效推理与快速实验路径上的集体突破,为低成本部署和架构创新提供基础设施。
2025-06-05

开源生态全面突围

清华、华为、智源、日本Shisa等相继开源超长视频、MoE训练优化、数学证明及日语大模型,叠加NVIDIA Llama-Nemotron系列,开源模型在性能、效率、多模态上正面抗衡闭源,全球AI创新重心向开源倾斜。