2026-01-06
AI硬件终端大战
谷歌Gemini登陆Google TV并计划2026年覆盖8亿三星设备;高通骁龙数字底盘牵手谷歌AI智能体,零跑首批上车;Rokid、字节豆包、XREAL、华硕ROG 240Hz眼镜等AI眼镜密集发布或出货,终端形态从电视、汽车到可穿戴全面AI化,争夺下一代交互入口。
2025-11-30
AI基础设施外延:太空算力竞赛
Starcloud-1卫星把英伟达H100送上轨道,谷歌随即公布“太阳捕手”TPU卫星计划,低轨卫星集群有望提供全球边缘AI推理与训练能力。算力战场从地面数据中心扩展到近地空间,开启“太空超算”新赛道,牵动航天、芯片、能源多重产业。
2025-10-18
高效推理与模型协作框架
R-Stitch动态拼接、北航-浙大4倍提速、EXO Lab Mac Studio 2.77倍加速等方案,通过“大小模型协同”“消费级硬件分布式”降低推理成本,缓解算力焦虑。技术路线已获学术与工程双重验证,预示云端与边缘混合部署将成为大模型落地标配。
2025-07-10
端侧小模型爆发
vivo发布3B多模态模型BlueLM-2.5,可在手机端理解GUI界面;微软Phi-4-mini推理提速10倍,笔记本可跑;港大&字节4B数学模型用RL逼近235B性能。小参数+高能力+本地部署,降低推理成本与隐私风险,为移动、IoT、边缘计算打开增量市场。
2025-07-01
终端智能与边缘部署
英特尔助力文心大模型端侧落地,苹果Vision Pro新路线图曝光,轻量模型与AI眼镜、手机、车载芯片结合,预示“云-边-端”混合推理时代加速到来。
2025-02-27
端侧与专用硬件AI
极氪首创车规级端侧大模型离线部署,Arm发布首个Armv9边缘AI平台,火山引擎推DeepSeek一体机小时级交付,显示大模型正向终端、车载、IoT场景下沉,边缘算力与模型压缩成为新战场。
2025-01-24
边缘轻量AI与端侧落地
Hugging Face推出SmolVLM、MiniRAG等1-2B级小模型,在手机、车载、玩具等终端实现300倍体积压缩、75%存储节省,仍保持90%以上性能;JetBrains Junie、跃问App等原生IDE/创意工具集成,显示“小模型+端侧”正成为AI普惠新路径,降低云成本与隐私风险。
2025-01-06
AI硬件创新潮
英伟达RTX 5090/5080显卡、三星Vision AI电视、Roborock机械臂扫地机、Circular Ring2智能戒等集中亮相,AI算力与场景硬件同步升级,边缘推理成本下降,端侧智能进入落地爆发期。
2025-01-03
AI PC与端侧硬件混战
英伟达、微软、三星等巨头集中发布AI PC芯片或整机,黑芝麻车规芯片成功部署通义千问,显示大模型正向边缘端迁移,将重塑消费电子与汽车电子供应链。
2024-11-01
端侧小模型崛起
苹果、Meta、 Mistral 等巨头加速推进 SLM(小语言模型),在笔记本与手机端实现数十亿参数本地运行,HybridFlow、MobileLLM 等开源工具将训练速度提升 20 倍,边缘 AI 进入实用爆发期。
2024-10-17
AI硬件与终端落地潮
从6.98万元人形机器人TRON 1、2800元AI宠物到小米智能戒指、摩托罗拉Moto AI,再到联想“超大号”AI PC与3nm手机SoC,终端形态百花齐放,预示AI正从云端向边缘与个人设备快速渗透,硬件入口争夺战全面打响。
2024-10-14
端侧AI硬件新物种
1200元AI耳机、2000美元平价Vision头显、T级算力血压计集中亮相,端侧大模型催生消费电子新品类,边缘计算生态快速扩张。
2024-10-04
RNN架构革新
Bengio团队提出精简RNN新架构,在保持线性复杂度的同时性能对标Transformer,为边缘端和超长序列任务提供高效替代方案,或冲击当前主流注意力机制。
2024-09-15
终端 AI 与硬件创新
谷歌向安卓用户免费开放 Gemini Live 新助手,苹果 Apple Watch 将原生支持打鼾/睡眠呼吸暂停检测。巨头把大模型能力下沉到手机、可穿戴,加速边缘 AI 普及并激活新数据入口。
2024-09-05
终端AI与硬件加速
英特尔发布Ultra 200V系列旗舰AI PC芯片,长虹将推首款AI电视自研云帆平台,Win11内置国产RWKV大模型,终端侧算力与模型深度耦合,边缘AI体验进入“无感集成”阶段。
2024-08-03
模型小型化与端侧部署
Google发布仅2.6B参数的Gemma 2 2B并配套ShieldGemma安全分类器,加上行业人士关于“大模型重走CNN瘦身老路”的讨论,显示高效小模型正成为端侧、边缘及低成本场景的新焦点。
2024-07-18
终端AI与边缘硬件落地
三星AI空调、AI PC换机潮、Gemini锁屏问答、Claude安卓版等密集发布,显示大模型正加速向手机、家电、PC端渗透,推动边缘计算与低功耗芯片需求爆发。
2024-07-16
端侧与边缘AI落地
H2O-Danube3实现手机离线运行,iPhone/iPad/MacBook异构集群可本地跑Llama 3,微软SpreadsheetLLM让Excel直接理解自然语言指令,谷歌Vids测试Gemini一键生成演示视频,显示大模型正向轻量化、办公场景、边缘设备快速下沉。
2024-06-01
Scaling Law与模型效率前沿
最新论文揭示观测缩放定律,为复杂现象提供可预测框架;神经网络量化白皮书聚焦边缘端功耗与延迟优化,结合Transformer生成模型提升蛋白-蛋白构象采样效率,显示大模型在“更大”与“更轻”两极同步进化。
2024-05-08
端侧与多模态Agent爆发
斯坦福Octopus V3以20亿参数实现端侧多模态Agent,函数调用性能超GPT-4,能耗降95%;亚马逊、苹果M4芯片同步强调本地AI算力。端侧轻量化+多模态交互成为新战场,将加速AI在手机、汽车、机器人等场景落地,重构边缘计算生态。