2026-01-15
硬件-模型协同革命
OpenAI百亿美金押注Cerebras晶圆级巨芯,英伟达开源TTT-E2E记忆压缩,苹果Gemini入机,国产GPU一年双芯量产,算力与模型联合重构,开启低延迟、高带宽、高能效新范式。
2024-09-10
芯片与算力格局生变
AMD放弃旗舰游戏GPU转向统一AI架构,Cerebras推最快推理芯片挑战英伟达,Apache Cassandra 5.0原生AI索引,反映后CUDA生态加速分化,推理侧算力需求催生新硬件机会。
2024-09-01
大模型推理与芯片竞速
Cerebras发布1800 tokens/s的Llama3.1 8B推理架构,速度较GPU提升20倍;Mamba作者把Llama3蒸馏成混合线性RNN,兼顾效率与效果。专用芯片+新型架构双轮驱动,推理成本有望再降一个量级,为大模型普及铺路。
2024-08-29
AI芯片与算力军备赛
英伟达Blackwell称霸MLPerf,Cerebras凭世界最大芯片实现推理速度20倍碾压H100,燧原科技冲刺IPO获腾讯押注,特斯拉Cortex集群部署5万片H100,算力竞赛进入“万卡”甚至“专芯”时代。
2024-08-28
AI硬件与算力竞速
Cerebras宣称推出“世界最快”AI推理服务,速度提升20倍挑战英伟达;燧原科技冲刺A股IPO,腾讯持股超20%。专用芯片与新型算力架构成为打破GPU垄断的关键变量,推理成本有望再降一个量级。
2024-03-15
AI芯巅峰对决
Cerebras发布5nm 4万亿晶体管WSE-3,单颗芯片可训24万亿参数模型,一天完成Llama 70B训练,算力密度刷新纪录。硬件军备竞赛再升级,为下一代大模型提供“超级发动机”,也将重塑AI基础设施格局。