2026-04-12

端侧高效视觉Transformer

CARE Transformer以非对称解耦架构在iPhone/iPad实现超低延迟高精度,突破端侧视觉Transformer效率瓶颈,为移动AI落地提供新范式,入选CVPR'25。
2026-04-04

多模态原生统一架构

谷歌、商汤、美团等头部厂商集体转向“原生多模态”统一Token架构,把图像、语音、文本当作同一序列预测,彻底抛弃拼接式方案。Gemma 4、NEO-unify、Wan2.7等模型先后落地,端侧可跑、性能越级,标志多模态技术进入“统一输入-统一输出”新范式,将重塑模型设计、算力需求与下游应用标准。
2026-04-02

端侧AI与硬件融合

中兴-字节豆包AI手机定档Q2,千问AI眼镜OTA升级同传克隆,联想宣布两年千亿营收目标并转型AI原生公司,终端厂商把大模型塞进每一台设备,AI硬件进入规模化落地期。
2026-04-01

端侧AI与硬件融合加速

联想宣布全面转型AI原生公司并推出0.65L AI迷你主机,苹果iOS 27将内置AI纠错键盘,Meta升级Ray-Ban智能眼镜支持多度数定制,显示AI正从云端下沉到终端,硬件重构成为新战场。
2026-03-26

大模型高效压缩突破

谷歌TurboQuant将KV缓存压缩6倍实现模型瘦身而不掉点,引发内存股大跌;苹果同步用知识蒸馏把Gemini浓缩进iPhone端侧,蚂蚁F2LLM-v2以1/10参数横扫MTEB十一项冠军,显示“大模型小型化”正成为性能与成本的新战场。
2026-03-24

端侧大模型与硬件创新

iPhone 17 Pro本地跑4000亿参数模型、玄铁C950原生支持千亿模型、AMD提出“养龙虾”双机方案,端侧算力与芯片架构快速演进,边缘AI进入实用。
2026-03-21

端侧AI芯片与龙虾生态爆发

国产“龙虾”CPU、OpenClaw框架及专属芯片集中亮相,两个月GitHub星标破32万,英伟达、阿里、Arm合力站台,端侧AI算力自主化与终端普及进入加速期。
2026-03-11

端侧AI与硬件创新

荣耀Magic V6首发端侧AI智能体“龙虾宇宙”,开源框架OpenClaw实现多设备协同;小米18系列曝光新增AI实体键,探索硬件交互新范式;苹果M5 Max MacBook Pro续航破27小时,为端侧大模型提供极致能效,终端AI体验竞争升级。
2026-03-09

小模型逆袭大模型

阿里通义千问Qwen3.5-4B仅用2%参数(40亿)在第三方评测中打平甚至超越千亿级GPT-4o,开启“以小博大”新范式;BOSS直聘3B模型海外病毒式传播,性能对标32B;UniPat AI开源30B科研模型硬刚Gemini、Claude,48小时GitHub揽星9.5k。参数效率革命降低本地部署成本,为端侧和中小企业带来普惠AI能力。
2026-03-05

端侧AI与硬件融合

华为将发AI眼镜支持拍摄+同声传译;高通推“胸针级”20亿参数本地模型;苹果M5 MacBook续航破24小时。端侧算力与模型压缩并进,让AI无缝融入穿戴、PC、家居,宣告“离线也能大模型”时代逼近,将重塑交互与数据隐私模式。
2026-03-04

开源框架与端侧AI爆发

OpenClaw以25.2万星登顶GitHub历史第一,阶跃星辰开源1960亿MoE模型Step3.5Flash,蚂蚁+清华发布AReaL强化学习框架,理想汽车提出端侧Scaling Law,标志开源生态与端侧部署进入“免训练、一键接入”新阶段,开发者门槛骤降。
2026-02-10

端侧模型极致压缩

腾讯混元发布0.3B 2Bit产业级端侧模型,内存<600MB;华为推出扩散语言模型Agent,部分场景提速8倍;清华&千问重塑归一化让Transformer深度回归,推动大模型在消费级硬件与边缘场景落地,端侧智能迎来“可用”拐点。
2026-01-26

硬件算力与存储涨价潮

AI训练与端侧推理需求爆发,三星NAND价格一季度翻倍,封测环节同步提价,北京“十五五”规划锁定AI为万亿集群,显示AI正重塑全球半导体供应链与区域产业格局。
2026-01-21

端侧小模型突破

Liquid AI 1.2B推理模型仅900MB内存即可在手机离线运行“思考”模式,非Transformer架构的液态神经网络与英伟达ToolOrchestra小模型调度框架共同验证:小参数+高效工具调用可在端侧实现接近大模型的推理与Agent能力,端侧AI临界点已至。
2026-01-17

端侧与消费级AI普及

联发科天玑9500s将旗舰NPU下放中端手机,谷歌Gemini3驱动Personal Intelligence整合全家桶,DLSS 4.5用Transformer提升游戏画质与帧率,端侧AI体验正快速渗透日常设备。
2026-01-09

端侧与本地AI算力崛起

戴尔推出桌面超级计算机GB10,可在本地跑70亿参数模型;摩尔线程升级SimuMax分布式训练仿真平台,摩尔线程与戴尔共同推动“云-边-端”协同,缓解GPU内存瓶颈,让中小开发者摆脱昂贵云依赖,进入普惠AI时代。
2026-01-08

端侧AI与硬件生态

Rokid 38.5g无屏AI眼镜仅299美元直挑Meta;阿里云推多模态开发套件;联想发布个人超级智能体Qira。轻量级交互、开放SDK与多端协同成为端侧AI落地三要素,预示“AI硬件平民化”时代开启。
2026-01-07

端侧AI与硬件融合

CES 2026集中展示端侧AI芯片、AI PC、AI眼镜、机器人等硬件创新,AMD、英伟达、联想、惠普、雷蛇等巨头发布新一代算力平台与终端,推动AI从云端向本地设备迁移,降低推理成本,开启“AI+硬件”融合新周期。
2025-12-30

端侧AI模型瘦身与离线部署

腾讯混元1.5、三星Exynos2600、WitNote等集中展示“模型压缩+端侧落地”路径:翻译、笔记、芯片级优化把大模型塞进手机与PC,无需联网即可运行,既降本又解决隐私与延迟痛点,标志着AI从云端走向普惠硬件的关键拐点。
2025-12-24

端侧AI与AI手机生态爆发

中兴×字节“豆包手机”打响开放生态第一枪,阿里、苹果、华为同步加码端侧大模型与AI OS,AI手机、AI主机、AI机器人租赁等多元终端形态集中落地,标志端侧算力、模型压缩与多模态交互进入商用拐点,2026或成“AI硬件普及元年”。