2026-03-04

硬件-软件协同新基建

英伟达追投硅光子公司Ayar Labs 5亿美元并即将发布Groq-LPU推理芯片,讯飞40克AI眼镜亮相MWC,中兴努比亚AI原生手机深度集成豆包,显示“专用芯片+轻量化终端+大模型”正成为AI新基建标准组合,算力与形态双轨革新。
2025-10-26

大模型推理与系统优化

NVIDIA联合港大、MIT推出Fast-dLLM v2,端到端吞吐提升2.5倍;同时上下文敏感框架解决位置偏差,显示大模型系统层创新仍是落地关键,硬件-算法协同优化空间巨大。
2025-10-26

端侧AI与全场景硬件协同

荣耀展示跨终端AI流转,马桶等边缘设备亦植入视觉语言模型,预示AI计算正从云端下沉到每一个节点;硬件即服务(HaaS)时代开启,数据闭环与隐私计算成为新战场。
2024-02-16

大模型训练与推理优化

从32位到8位乃至更低精度的神经网络量化成为打破万亿参数内存墙的关键路径,英伟达、谷歌、微软等巨头同步推进硬件与算法协同创新,为超大模型低成本部署铺平道路。