2025-12-27
芯片格局再洗牌
英伟达200亿美元收购Groq、推出NVFP4低精度训练,TPU之父加入老黄阵营,GPU推理效率逼近极限,ASIC+GPU混合架构成新战场,决定未来AI算力成本与模型迭代速度。
2025-08-27
超高效推理与架构革新
NVIDIA Jet-Nemotron、谷歌Gemini 2.5 Flash Image、华为云384超节点等集中发布,通过FP4/FP8混合精度、后NAS架构、超节点Scale-Up把推理成本砍90%以上,吞吐提升数十倍,标志大模型进入“低价高并发”时代,将直接重塑云厂商定价、AI应用商业模式与边缘部署格局。
2025-02-01
高效训练与硬件协同创新
微软首发FP4训练框架效果对标BF16,谷歌、阿里、华为云等同步优化推理服务,表明在摩尔定律放缓背景下,算法-硬件协同正成为大模型降本增效的新主线。