RTX - AI话题 - AI快开门

2026-07-12

端侧大模型与边缘算力革新

谷歌Gemma 4实现端侧原生多模态与深度推理，英伟达RTX Spark让笔记本运行120B参数模型，标志着AI从云端向边缘终端迁移的关键拐点。端侧算力爆发不仅降低延迟与成本，更在隐私保护和实时性上开启新范式，推动消费级硬件成为独立智能载体。

端侧AI 边缘计算 Gemma 4 RTX Spark 模型轻量化

2026-06-02

端侧AI与硬件革命

端侧AI与AI硬件迎来重大突破，华为HarmonyOS 7聚焦端侧AI与智能体升级，英伟达发布RTX Spark PC处理器打造AI智能体PC。WIKO发布AI萌宠硬件星仔，明略科技开源端侧推理框架，特斯拉升级车载AI语音，显示AI能力正从云端向终端设备全面渗透。

端侧AI AI硬件 HarmonyOS RTX Spark AI PC

2026-02-08

GPU供应链震荡

全球显存短缺迫使英伟达30年来首次推迟RTX 50 Super与RTX 60系列，复产RTX 3060救急，显示AI芯片需求对消费级GPU发布节奏的决定性影响，游戏市场被迫让路AI。

显存短缺 RTX延期英伟达供应链 AI芯片

2025-05-08

硬件-云生态竞合

英伟达50系甜品卡定价2499元、华为NPU跑万亿参数模型、腾讯网络框架助DeepSeek提速100%，表明中美硬件生态并行演进。GPU性价比战+国产算力突破+云侧优化，将决定大模型训练与推理成本曲线。

RTX 5060 华为NPU DeepSeek 算力成本云优化

2025-03-11

多模态与端侧推理提速

Zoom“草稿链”砍掉80%推理token，LayerSkip自推测解码加速大模型，字节开源MoE训练代码，RTX 5000 Ada成端侧新宠，显著降低延迟与成本，为端侧大模型规模化部署铺平道路。

草稿链 LayerSkip 端侧推理 MoE RTX5000

2025-01-18

英伟达AI生态再升级

RTX 5090D对华特供版锁死AI算力，DLSS 4引入Transformer帧生成，游戏帧率破200；同时提供人形机器人全套计算平台，显示英伟达在AI训练、推理及边缘AI的全面布局。

RTX5090D DLSS4 Transformer 帧生成机器人计算

2025-01-09

端侧与硬件加速落地

RTX 5090/5070显卡、联想Legion Pro笔记本、AI眼镜雷鸟V3等集中亮相CES，结合Nvidia Groot Teleop机器人训练与三星AI订阅俱乐部，表明AI正向端侧芯片、可穿戴与机器人快速渗透。

端侧AI RTX5090 AI眼镜机器人 CES

2025-01-08

英伟达CES 2025硬件爆发

RTX 5090系列GPU、Project Digits桌面AI超算、世界模型Cosmos平台集中发布，性能与摩尔定律脱钩式跃升；同时G-Assist AI助手落地消费端，奠定“新计算平台”生态。

RTX5090 Project Digits Cosmos 英伟达世界模型

2025-01-07

英伟达CES 2025全栈发布

英伟达在CES 2025一次性推出RTX 5090旗舰GPU、生成式世界基础模型Cosmos、视频分析AI代理蓝图、最小AI超算Project Digits及具身智能标准训练流程，从芯片、模型到机器人训练框架全面卡位物理AI时代，奠定万亿美元机器人市场基础设施。

RTX 5090 Cosmos Project Digits 具身智能物理AI

2024-10-01

硬件算力升级与终端AI

英伟达RTX 5090规格泄露，CUDA核心与显存大幅提升；AI手机、AIPC强调安全计算；国产万卡集群支撑万亿模型，硬件性能与基础设施升级成为大模型落地关键支撑。

RTX5090 算力 AI手机 AIPC 万卡集群

2024-09-27

芯片与算力军备赛

英伟达RTX 5090功耗600W、谷歌AlphaChip开放自动设计、三星联发科已采用，国家超算互联网平台提供免费国产算力，硬件-算法协同进入新阶段。

RTX5090 AlphaChip 超算算力 AI芯片

2024-05-02

气候AI与消费级算力

中科院提出可学习气候模型，尝试用AI平衡物理规律与数据驱动；英伟达RTX生态破1亿用户，消费级GPU跑大模型成趋势，降低科研与开发者门槛。

气候模型消费级GPU RTX 物理AI 算力普惠

2024-02-29

端侧与消费级AI算力门槛骤降

英伟达RTX 500/1000 Ada移动工作站、微软1Bit三进制大模型、陈丹琦128k Llama-2推理优化等硬件与算法协同突破，使大模型可在本地低功耗运行，端侧AI应用即将规模化爆发。

端侧AI RTX GPU 1Bit量化推理优化消费级

2024-02-15

英伟达本地AI聊天机器人

英伟达发布Chat With RTX，让消费级GPU在本地运行类ChatGPT大模型，无需联网即可对话，降低延迟并强化隐私，同时展示RTX生态对生成式AI的硬软件统治力，冲击云端主导的大模型部署模式。

英伟达 RTX 本地部署 Chat With RTX 边缘AI

2024-01-10

硬件巨头抢跑AI PC与边缘算力

NVIDIA RTX 40 SUPER、荣耀魔法OS、FlightLLM芯片等新品集中发布，终端侧大模型推理性能提升10-60倍，AI PC与手机本地化运行百亿参数模型成为2024开年最大硬件叙事。

AI PC RTX 40 FlightLLM 边缘推理荣耀

# RTX