MoE - AI话题 - AI快开门

2026-06-28

模型训练与推理效率优化

英伟达开源NeMo AutoModel实现MoE模型微调3.7倍加速；清华UDS通过智能样本筛选降低SFT算力；北大与智源提出机理数据归因；华为关键帧选择破解长视频算力瓶颈。从训练数据优化到推理框架加速，全链条效率提升成为行业焦点，推动大模型在学术与工业场景更易部署。

训练效率 MoE 数据筛选算力优化 ICML

2026-05-25

模型优化与AI基础设施

面壁智能联合清华发布中国首个1.58-bit大模型BitCPM-CANN，实现低比特训练突破；清华联合腾讯混元获MLSys MoE推理挑战赛冠军，NPU推理提速4.1倍；得州拟建2.5吉瓦核电燃气混合电站应对AI用电激增；EdgeRazor实现解码加速15倍。模型压缩、推理优化与能源基础设施成为AI规模化关键支撑。

模型压缩推理优化能源基础设施 MoE架构边缘计算

2026-05-10

多语言与数据高效模型新路径

南大团队提出ParamΔ+Upcycled MoE组合，仅用少量目标语言数据即可把单语LLM升级为多语大模型，低资源语言性能大幅提升；HiLight框架实现长文原文划重点，减少切片幻觉，共同指向“轻数据、重结构”的模型扩展新方向。

多语言LLM ParamΔ Upcycled MoE 数据高效 HiLight

2026-05-04

模型效率与架构创新

中科院瞬悉2.0、DeepSeek Mega MoE及SonicMoE等方案，针对长序列与低功耗场景优化架构，显著降低推理成本，为端侧部署和多模态交互提供高效替代，缓解Transformer规模瓶颈。

长序列 MoE 低功耗瞬悉2.0 架构优化

2026-03-28

模型架构与训练突破

Anthropic意外泄露“Capybara”新架构全面碾压Opus 4.6，北大提出Frozen Policy迭代算法刷新强化学习样本效率，MoE与ViSNet-PIMA等结构创新持续推高模型性能与科学计算精度，底层技术仍在快速演进。

模型架构强化学习 MoE 科学计算

2026-03-04

开源框架与端侧AI爆发

OpenClaw以25.2万星登顶GitHub历史第一，阶跃星辰开源1960亿MoE模型Step3.5Flash，蚂蚁+清华发布AReaL强化学习框架，理想汽车提出端侧Scaling Law，标志开源生态与端侧部署进入“免训练、一键接入”新阶段，开发者门槛骤降。

OpenClaw 端侧Scaling 开源MoE AReaL GitHub

2025-11-28

芯片外销与算力基建军备赛

谷歌 2027 年拟向 Meta 外销百万 TPU，创收 130 亿美元；华为开源准万亿 MoE 推理方案，无问芯穹再获 5 亿元融资，云边端软硬协同成为 AI 基础设施竞争焦点，算力商品化加速。

TPU外销算力基建 MoE 融资

2025-11-25

国产全模态/多模态模型加速开源

昆仑元发布BaiZe-Omni-14b-a2b全模态融合模型；哈深Uni-MoE-2.0-Omni实现文本、图像、音频统一SOTA；腾讯开源1B参数HunyuanOCR刷新多项记录。国产模型以轻量参数、全模态能力、开源策略快速迭代，降低行业落地门槛，对下游应用与开发者生态形成强支撑。

全模态模型国产开源 HunyuanOCR Uni-MoE BaiZe-Omni

2025-10-30

AI编程工具升级战

Cursor 2.0推出自研Composer模型，8 Agent并行编码速度提升4倍；Lovable 8个月ARR破亿，验证“AI+低代码”商业化路径；编程大模型进入MoE+强化学习新范式，开发者效率迎来“核爆级”升级。

AI编程 Cursor 低代码 MoE 开发者效率

2025-10-26

AI算法自我进化

伯克利ADRS系统让AI 5小时自研MoE训练算法，速度提升5倍、成本降26%，标志算法发现进入“无人区”，科研范式从人类设计转向机器自主迭代，将重塑算力与模型经济。

AI for Algorithms MoE AutoML 科研范式算力成本

2025-09-17

编程大模型军备赛

OpenAI连发GPT-5-Codex系列，支持7小时连续编码与动态算力分配；国内蚂蚁开源MoE模型Ling-flash-2.0以6.1B参数比肩40B Dense，Cursor、CodeRabbit等AI编程工具融资与功能迭代加速，行业进入“自动化软件工程”新阶段。

GPT-5-Codex AI编程 MoE模型 Cursor CodeRabbit

2025-09-12

开源大模型技术突破

阿里Qwen3-Next、字节HuMo、阿里妈妈SDH等多款开源大模型密集发布，MoE与扩散架构成为新主流，训练成本骤降90%，性能逼近GPT-5，标志国产开源进入全球第一梯队，将加速行业落地与生态繁荣。

开源大模型 MoE 扩散模型 Qwen3 训练降本

2025-08-11

算法与算力底层创新

清华团队打破40年Dijkstra最优性神话，新最短路径算法登STOC最佳；谷歌DeepMind Perch 2.0刷新1.5万物种生物声学SOTA；MoE超级专家机制、Kitten 1500万参数TTS等轻量模型涌现，显示底层算法与架构创新仍在加速。

最短路径算法突破生物声学轻量模型 MoE

2025-08-07

OpenAI 6年后再开源

OpenAI 时隔六年推出 gpt-oss-20b/120b 两款开源 MoE 模型，性能逼近 o4-mini，Apache 2.0 授权+MXFP4 量化，笔记本可跑；同步流出 GPT-5 四版本路线图，标志其从封闭走向开源生态，牵动全球开发者与竞争格局。

OpenAI gpt-oss GPT-5 开源 MoE

2025-07-24

开源编程模型爆发

阿里Qwen3-Coder、5ire等开源模型刷新代码生成SOTA，支持1M上下文、MoE架构，性能对标Claude 4但成本骤降，引爆“零门槛”AI编程生态，直接冲击闭源商业模型市场。

开源代码生成 Qwen3-Coder AI编程 MoE

2025-07-13

国产大模型开源竞速

Kimi发布1T MoE模型K2并同步开源，在代码、Agent、数学基准全线SOTA；人大提出DNA基础模型SPACE，seq2func预测刷新纪录。国产大模型进入“万亿参数+开源”阶段，降低研究门槛，加速垂直领域落地与生态竞争。

Kimi 1T MoE 开源国产大模型 DNA模型

2025-07-03

国产大模型开源爆发

华为盘古、智谱GLM、字节VINCIE、B站AniSora等国产大模型密集开源，覆盖MoE、多模态、视频生成等方向，参数规模从3B到72B不等，性能对标国际闭源模型，标志国产AI进入“开源反哺生态”新阶段，显著降低开发者门槛并加速行业落地。

开源大模型 MoE 国产多模态

2025-07-01

超大模型新王争霸

Gemini 2.5 Pro、百度文心4.5系列等旗舰模型密集开源或升级，百万级长上下文、MoE架构与多模态能力成为竞逐焦点，直接重塑开发范式与商业落地门槛。

Gemini 2.5 Pro 文心4.5 长上下文 MoE 开源