2025-05-08
硬件-云生态竞合
英伟达50系甜品卡定价2499元、华为NPU跑万亿参数模型、腾讯网络框架助DeepSeek提速100%,表明中美硬件生态并行演进。GPU性价比战+国产算力突破+云侧优化,将决定大模型训练与推理成本曲线。
2025-03-11
多模态与端侧推理提速
Zoom“草稿链”砍掉80%推理token,LayerSkip自推测解码加速大模型,字节开源MoE训练代码,RTX 5000 Ada成端侧新宠,显著降低延迟与成本,为端侧大模型规模化部署铺平道路。
2025-01-18
英伟达AI生态再升级
RTX 5090D对华特供版锁死AI算力,DLSS 4引入Transformer帧生成,游戏帧率破200;同时提供人形机器人全套计算平台,显示英伟达在AI训练、推理及边缘AI的全面布局。
2025-01-09
端侧与硬件加速落地
RTX 5090/5070显卡、联想Legion Pro笔记本、AI眼镜雷鸟V3等集中亮相CES,结合Nvidia Groot Teleop机器人训练与三星AI订阅俱乐部,表明AI正向端侧芯片、可穿戴与机器人快速渗透。
2025-01-08
英伟达CES 2025硬件爆发
RTX 5090系列GPU、Project Digits桌面AI超算、世界模型Cosmos平台集中发布,性能与摩尔定律脱钩式跃升;同时G-Assist AI助手落地消费端,奠定“新计算平台”生态。
2025-01-07
英伟达CES 2025全栈发布
英伟达在CES 2025一次性推出RTX 5090旗舰GPU、生成式世界基础模型Cosmos、视频分析AI代理蓝图、最小AI超算Project Digits及具身智能标准训练流程,从芯片、模型到机器人训练框架全面卡位物理AI时代,奠定万亿美元机器人市场基础设施。
2024-10-01
硬件算力升级与终端AI
英伟达RTX 5090规格泄露,CUDA核心与显存大幅提升;AI手机、AIPC强调安全计算;国产万卡集群支撑万亿模型,硬件性能与基础设施升级成为大模型落地关键支撑。
2024-09-27
芯片与算力军备赛
英伟达RTX 5090功耗600W、谷歌AlphaChip开放自动设计、三星联发科已采用,国家超算互联网平台提供免费国产算力,硬件-算法协同进入新阶段。
2024-05-02
气候AI与消费级算力
中科院提出可学习气候模型,尝试用AI平衡物理规律与数据驱动;英伟达RTX生态破1亿用户,消费级GPU跑大模型成趋势,降低科研与开发者门槛。
2024-02-29
端侧与消费级AI算力门槛骤降
英伟达RTX 500/1000 Ada移动工作站、微软1Bit三进制大模型、陈丹琦128k Llama-2推理优化等硬件与算法协同突破,使大模型可在本地低功耗运行,端侧AI应用即将规模化爆发。
2024-02-15
英伟达本地AI聊天机器人
英伟达发布Chat With RTX,让消费级GPU在本地运行类ChatGPT大模型,无需联网即可对话,降低延迟并强化隐私,同时展示RTX生态对生成式AI的硬软件统治力,冲击云端主导的大模型部署模式。