2025-11-01
算力军备竞赛升级
OpenAI万亿美元级GPU采购、国产摩尔线程80亿IPO获批、PyTorch&Triton双会聚焦编译器,显示AI竞争已从算法转向算力+系统软件。掌握万卡集群与高性能编译链,成为模型迭代与商业落地的生死线,直接决定AGI节奏与产业链定价权。
2025-06-11
终端AI芯片与硬件创新
高通发布骁龙AR1+ Gen 1支持设备端AI,华为宣布万卡集群训练可用度达98%,玉盘AI提出20人团队定制大模型芯片方案,中科院「启蒙」实现处理器全自动设计,硬件层围绕AI训练与推理的专用化、高可用、全自动趋势明显,为下一轮算力竞赛奠定基础。
2025-06-09
端侧与高效推理创新
面壁“小钢炮”架构、SLOT 样本级优化、华为昇腾万卡集群等方案,将长文本与大规模模型推理成本降低数十倍,推动端侧部署和实时应用普及。
2025-02-07
资本与算力竞赛
亚马逊宣布2025年AI投入超1000亿美元,百度自研万卡集群点亮并三折售卖DeepSeek算力,Cerebras、Mistral联手刷新训练速度纪录,算力军备赛再升级。
2025-02-06
国产算力与生态突破
百度智能云点亮昆仑芯三代万卡集群,单位算力成本大幅下降;潞晨联合华为推出基于昇腾910B的DeepSeek-R1免费API,性能直追英伟达,标志着国产芯片+开源模型组合进入可用、好用阶段。
2024-10-01
硬件算力升级与终端AI
英伟达RTX 5090规格泄露,CUDA核心与显存大幅提升;AI手机、AIPC强调安全计算;国产万卡集群支撑万亿模型,硬件性能与基础设施升级成为大模型落地关键支撑。
2024-09-04
大模型算力军备赛
OpenAI、xAI、无问芯穹等巨头与独角兽集体加码万卡级算力集群,自研芯片、10万GPU超级计算机、10亿元融资密集落地,标志着大模型进入“算力即护城河”时代,直接决定下一代模型性能与商业落地速度。
2024-08-01
大模型训练与算力竞赛
Meta、OpenAI、百度等头部厂商披露下一代模型训练规模,Llama-4算力需求10倍于Llama-3,Apple Intelligence、PaddleMIX 2.0同步升级,训练-推理一体化与量化压缩成为降本关键,行业进入“万卡”常态化阶段。
2024-07-30
巨头模型训练与硬件瓶颈
Llama 3.1 405B用1.6万块H100平均3小时故障一次,GPU与HBM3显存成最大元凶;英伟达联手Hugging Face推推理服务Token效率提升5倍,揭示万卡集群稳定性与算力利用率仍是行业天花板。
2024-07-04
国产万卡GPU集群
国产GPU厂商建成万卡万P集群,实现千卡异构混训,打破英伟达垄断,为大模型训练提供自主可控算力底座,被视为“中国英伟达”的关键里程碑。
2024-06-24
算力军备与集群挑战
SemiAnalysis深度拆解10万卡H100集群技术难点,揭示“有钱买卡≠堆出算力”,网络、供电、可靠性皆成瓶颈;国内CCF发起大模型安全挑战赛悬赏30万,蚂蚁成立“天象实验室”护航下一代基础设施,显示算力、安全、运维正成为AI竞赛的隐形战场。