AI快开门

发现最好的AI工具

2025-12-01

算力格局生变

谷歌TPU v7对外输出,宣称成本较英伟达GPU降30%,CUDA护城河被撕开第一道缺口;同时英伟达推出Orchestrator-8B强化学习控制器,试图以软件巩固硬件霸权,云厂商价格战一触即发。
2025-11-07

AI基础设施与成本骤降

OpenAI-AWS 380亿美元大单、谷歌圣诞岛数据中心、Gemini API文件搜索免费嵌入,叠加token年降900倍,AI算力与存储成本快速下探,加速应用普及。
2025-10-26

AI算法自我进化

伯克利ADRS系统让AI 5小时自研MoE训练算法,速度提升5倍、成本降26%,标志算法发现进入“无人区”,科研范式从人类设计转向机器自主迭代,将重塑算力与模型经济。
2025-10-22

AI基础设施与算力军备

甲骨文推出80万GPU的Zettascale超算服务OpenAI,国内鸿蒙6全面集成端侧AI,CVPR2026强制披露算力成本,显示大模型竞争正从算法转向极致算力与绿色高效架构。
2025-09-29

AI 基础设施与算力成本革命

浪潮信息实现 8.9 ms 推理、1 元/百万 token 新纪录;华为 CloudMatrix384 超节点第一时间支持 DeepSeek V3.2;FlashAttention 作者预言 GPU 垄断三年内终结,硬件-软件协同优化正把 AI 推理推向“白菜价”时代。
2025-09-15

成本与商业链重构

OpenAI计划削减微软分成以缓解算力支出,xAI裁员500名数据标注员,Cursor用强化学习降低Token开销,显示高算力成本正倒逼模型方、云厂商与开发者重新分配价值链,AI商业化进入“降本增效”深水区。
2025-08-12

推理效率与硬件优化

华为UCM、英特尔LLM-Scaler1.0、OpenAI gpt-oss MXFP4量化等技术将120B模型压入80GB卡,推理成本降75%、速度提4倍;高通宣布20B级gpt-oss可在骁龙终端离线跑,边缘大模型进入实用化,缓解云端算力瓶颈,推动端侧AI普惠。
2025-06-11

OpenAI o3系列降价升级

OpenAI正式推出o3-pro模型,可靠性更高、工具集成更强,同时o3价格暴降80%,并与谷歌云达成算力合作。CEO Sam Altman称单次ChatGPT查询仅耗1/15茶匙水,释放极致优化信号,预示AI算力成本战全面开打,将加速下游应用普及。
2025-05-08

硬件-云生态竞合

英伟达50系甜品卡定价2499元、华为NPU跑万亿参数模型、腾讯网络框架助DeepSeek提速100%,表明中美硬件生态并行演进。GPU性价比战+国产算力突破+云侧优化,将决定大模型训练与推理成本曲线。
2025-03-12

自研AI芯片潮

Meta、谷歌等巨头加速自研AI训练/推理芯片,测试内部替代方案,意在降低对英伟达GPU的依赖并压缩高达650亿美元级AI算力账单,预示全球算力格局可能重塑。
2025-02-01

高效训练与硬件协同创新

微软首发FP4训练框架效果对标BF16,谷歌、阿里、华为云等同步优化推理服务,表明在摩尔定律放缓背景下,算法-硬件协同正成为大模型降本增效的新主线。
2025-01-30

低精度训练新范式

微软首发FP4训练框架,在保持BF16精度的同时将显存与能耗减半,为大模型训练成本下降提供可扩展路径,利好国产卡与边缘算力部署。
2024-10-19

大模型训练成本与算力泡沫

红杉报告警告AI产业需年收6000亿美元才能覆盖GPU基础设施;H100租金跌至2美元/小时,价格暴跌75%,GPU供给过剩隐现。成本压力与资本支出贬值速度成为行业焦点,提示算力泡沫风险。
2024-01-22

AI芯片与算力基建新战事

奥特曼筹数十亿美元自建全球晶圆厂网络,欲打破英伟达垄断;国内傅盛展示百亿参数模型单卡3060可跑,边缘部署门槛骤降。算力成本已成大模型普及最大瓶颈,从芯片设计、代工到模型压缩,全栈式算力竞赛决定未来AI入口格局。