万卡集群 - AI话题

2026-07-12

国产十万卡超算集群落地

中科曙光“曙光8000”正式落成，实现全国产十万张加速卡协同运行，突破万卡瓶颈与网络、存储、散热等系统性工程难题。以“原生超智融合”架构兼顾科学计算高精度与AI高吞吐，标志着中国算力自主可控迈入“十万卡时代”，为下一代AI大模型与科学智能提供坚实底座。

国产算力十万卡集群超智融合自主可控曙光8000

2026-02-12

国产大模型春节爆发

春节前后，智谱GLM-5、MiniMax M2.5、字节Seedance2.0等国产旗舰大模型密集发布，在代码、医疗、视频生成等垂直场景刷新SOTA，并同步开源或开放API，带动国产算力（摩尔线程、万卡集群）完成深度适配，标志国产AI生态进入“模型-芯片-应用”闭环新阶段。

国产大模型万卡集群开源垂直场景 SOTA

2026-02-08

国产万卡算力集群落地

中科曙光3套scaleX万卡超集群同步上线，全国首个3万卡国产AI算力池投入实战，标志国产智算从示范走向规模化商用；马斯克拟用太空太阳能+卫星星座布局天基算力，中美在算力制高点展开不同路径竞速。

万卡集群国产算力太空算力智算基建中科曙光

2026-02-06

国产算力与模型突破

中科曙光3万卡国产集群在郑上线，支撑万亿参数训练；上海AI实验室开源Intern-S1-Pro万亿科学模型，国产最大算力池+最大开源多模态科学大模型双落地，缓解“卡脖子”焦虑。

国产算力 3万卡集群 Intern-S1-Pro 万亿模型 AI4S

2025-11-01

算力军备竞赛升级

OpenAI万亿美元级GPU采购、国产摩尔线程80亿IPO获批、PyTorch&Triton双会聚焦编译器，显示AI竞争已从算法转向算力+系统软件。掌握万卡集群与高性能编译链，成为模型迭代与商业落地的生死线，直接决定AGI节奏与产业链定价权。

万卡集群国产GPU 编译器 OpenAI 摩尔线程

2025-06-11

终端AI芯片与硬件创新

高通发布骁龙AR1+ Gen 1支持设备端AI，华为宣布万卡集群训练可用度达98%，玉盘AI提出20人团队定制大模型芯片方案，中科院「启蒙」实现处理器全自动设计，硬件层围绕AI训练与推理的专用化、高可用、全自动趋势明显，为下一轮算力竞赛奠定基础。

终端AI芯片万卡集群定制芯片全自动设计算力竞赛

2025-06-09

端侧与高效推理创新

面壁“小钢炮”架构、SLOT 样本级优化、华为昇腾万卡集群等方案，将长文本与大规模模型推理成本降低数十倍，推动端侧部署和实时应用普及。

端侧推理算力优化万卡集群 SLOT

2025-02-07

资本与算力竞赛

亚马逊宣布2025年AI投入超1000亿美元，百度自研万卡集群点亮并三折售卖DeepSeek算力，Cerebras、Mistral联手刷新训练速度纪录，算力军备赛再升级。

资本开支算力军备万卡集群训练加速

2025-02-06

国产算力与生态突破

百度智能云点亮昆仑芯三代万卡集群，单位算力成本大幅下降；潞晨联合华为推出基于昇腾910B的DeepSeek-R1免费API，性能直追英伟达，标志着国产芯片+开源模型组合进入可用、好用阶段。

国产算力昆仑芯昇腾万卡集群 DeepSeekAPI

2024-10-01

硬件算力升级与终端AI

英伟达RTX 5090规格泄露，CUDA核心与显存大幅提升；AI手机、AIPC强调安全计算；国产万卡集群支撑万亿模型，硬件性能与基础设施升级成为大模型落地关键支撑。

RTX5090 算力 AI手机 AIPC 万卡集群

2024-09-04

大模型算力军备赛

OpenAI、xAI、无问芯穹等巨头与独角兽集体加码万卡级算力集群，自研芯片、10万GPU超级计算机、10亿元融资密集落地，标志着大模型进入“算力即护城河”时代，直接决定下一代模型性能与商业落地速度。

自研芯片万卡集群算力融资 GPU 训练系统

2024-08-01

大模型训练与算力竞赛

Meta、OpenAI、百度等头部厂商披露下一代模型训练规模，Llama-4算力需求10倍于Llama-3，Apple Intelligence、PaddleMIX 2.0同步升级，训练-推理一体化与量化压缩成为降本关键，行业进入“万卡”常态化阶段。

Llama-4 算力10倍训练成本量化压缩万卡集群

2024-07-30

巨头模型训练与硬件瓶颈

Llama 3.1 405B用1.6万块H100平均3小时故障一次，GPU与HBM3显存成最大元凶；英伟达联手Hugging Face推推理服务Token效率提升5倍，揭示万卡集群稳定性与算力利用率仍是行业天花板。

Llama 3.1 H100故障万卡集群算力瓶颈英伟达

2024-07-04

国产万卡GPU集群

国产GPU厂商建成万卡万P集群，实现千卡异构混训，打破英伟达垄断，为大模型训练提供自主可控算力底座，被视为“中国英伟达”的关键里程碑。

万卡集群国产GPU 异构混训算力自主大模型训练

2024-06-24

算力军备与集群挑战

SemiAnalysis深度拆解10万卡H100集群技术难点，揭示“有钱买卡≠堆出算力”，网络、供电、可靠性皆成瓶颈；国内CCF发起大模型安全挑战赛悬赏30万，蚂蚁成立“天象实验室”护航下一代基础设施，显示算力、安全、运维正成为AI竞赛的隐形战场。

万卡集群算力瓶颈安全挑战赛基础设施运维

2024-03-02

国产AI基础设施突破

字节跳动联合北大发布MegaScale万卡集群系统，2天完成GPT-3训练，算力利用率超英伟达Megatron-LM；知乎实现90% GPU利用率的大模型训练/部署一体化方案，展示国产工程优化在超大规模预训练中的竞争力。

万卡集群训练效率 GPU利用率国产优化 MegaScale

AI快开门

发现AI的无限可能

# 万卡集群