2025-10-26
大模型推理与系统优化
NVIDIA联合港大、MIT推出Fast-dLLM v2,端到端吞吐提升2.5倍;同时上下文敏感框架解决位置偏差,显示大模型系统层创新仍是落地关键,硬件-算法协同优化空间巨大。
2025-10-26
端侧AI与全场景硬件协同
荣耀展示跨终端AI流转,马桶等边缘设备亦植入视觉语言模型,预示AI计算正从云端下沉到每一个节点;硬件即服务(HaaS)时代开启,数据闭环与隐私计算成为新战场。