AI快开门

发现最好的AI工具

2026-01-15

硬件-模型协同革命

OpenAI百亿美金押注Cerebras晶圆级巨芯,英伟达开源TTT-E2E记忆压缩,苹果Gemini入机,国产GPU一年双芯量产,算力与模型联合重构,开启低延迟、高带宽、高能效新范式。
2024-09-10

芯片与算力格局生变

AMD放弃旗舰游戏GPU转向统一AI架构,Cerebras推最快推理芯片挑战英伟达,Apache Cassandra 5.0原生AI索引,反映后CUDA生态加速分化,推理侧算力需求催生新硬件机会。
2024-09-01

大模型推理与芯片竞速

Cerebras发布1800 tokens/s的Llama3.1 8B推理架构,速度较GPU提升20倍;Mamba作者把Llama3蒸馏成混合线性RNN,兼顾效率与效果。专用芯片+新型架构双轮驱动,推理成本有望再降一个量级,为大模型普及铺路。
2024-08-29

AI芯片与算力军备赛

英伟达Blackwell称霸MLPerf,Cerebras凭世界最大芯片实现推理速度20倍碾压H100,燧原科技冲刺IPO获腾讯押注,特斯拉Cortex集群部署5万片H100,算力竞赛进入“万卡”甚至“专芯”时代。
2024-08-28

AI硬件与算力竞速

Cerebras宣称推出“世界最快”AI推理服务,速度提升20倍挑战英伟达;燧原科技冲刺A股IPO,腾讯持股超20%。专用芯片与新型算力架构成为打破GPU垄断的关键变量,推理成本有望再降一个量级。
2024-03-15

AI芯巅峰对决

Cerebras发布5nm 4万亿晶体管WSE-3,单颗芯片可训24万亿参数模型,一天完成Llama 70B训练,算力密度刷新纪录。硬件军备竞赛再升级,为下一代大模型提供“超级发动机”,也将重塑AI基础设施格局。
2024-03-14

GPT-4.5与超长上下文模型

OpenAI GPT-4.5 Turbo提前泄露,上下文窗口翻倍、知识截止2024年6月;零一万物开放30万汉字API,Cerebras新晶圆级芯片可训24万亿参数模型,标志大模型进入“长上下文+超大参数”新阶段,直接拉升生成式AI应用天花板。