2026-06-01
AI硬件与芯片创新
英伟达发布专为AI智能代理设计的Vera CPU和RTX Spark处理器,挑战苹果M系列。比亚迪发布4nm车规级智驾芯片璇玑A3,华为AI眼镜正式开售,Meta计划测试AI吊坠硬件。AIPC概念股受GTC大会催化集体高涨,显示端侧算力竞争白热化。
2026-05-29
端侧AI与边缘智能部署
端侧AI迎来密集突破,Liquid AI开源LFM2.5端侧模型,谷歌发布Coral Board开发板,苹果iOS 27计划通过蒸馏技术实现本地AI,科大讯飞推出AI眼镜。这些进展显示AI正从云端向手机、可穿戴设备等终端迁移,在保护隐私的同时降低推理成本,开启轻量化部署新阶段。
2026-05-28
具身智能与端侧AI硬件突破
AI向物理世界延伸,具身智能与端侧硬件成为新焦点。国产具身大模型Wall-OSS-0.5实现零样本部署突破;Mistral AI联手空客宝马进军高端制造;科大讯飞发布AI眼镜,谷歌推出珊瑚AI开发板支持离线大模型运行。这些进展推动AI从数字世界向实体产业渗透,标志着"实体AI"赛道的崛起。
2026-05-26
AI硬件、机器人与端侧智能
AI与硬件融合加速,擎朗发布小尺寸人形机器人XMAN-L1,海尔推出全球最轻AI外骨骼;端侧AI取得突破,面壁智能开源BitCPM-CANN释放显存红利,苹果Siri搭载万亿参数模型,展现边缘计算与物理AI新趋势。
2026-05-16
具身智能与端侧AI应用
具身智能迎来"先认知后行动"的非共识路径突破,深度机智获数亿元融资;手机端智能体(如Hermes)自主任务量激增,OpenHuman构建个人知识库。反映AI从云端向端侧、从虚拟向物理实体延伸,强调在资源受限环境下的自主决策与持续学习能力。
2026-05-14
端侧与硬件AI创新
OPPO推出首个手机端AIGC调色引擎,谷歌Gemini全面进驻安卓与AI鼠标,国产GPU获SGLang原生支持,表明AI正向终端、芯片与交互硬件深度渗透,边缘算力竞争开启。
2026-05-13
端侧多模态模型爆发
苹果 oMLX 0.3.9、面壁 MiniCPM-V 4.6、小米 MiMo 等轻量多模态模型密集发布,可在 6G 内存手机/PC 端高速运行,视觉推理与成本优势显著,标志“云端大模型”优势被快速拉平,端侧 AI 应用进入可用时代。
2026-05-11
端侧与本地AI提速
M4 MacBook 24GB内存本地跑9B模型达40 tokens/s,Chrome 148版悄然删除“本地处理”承诺,中国移动AI-eSIM把大模型塞进SIM卡,显示端侧算力与隐私博弈同步升级,离线AI体验正逼近云端水平。
2026-05-08
轻量化与本地推理浪潮
DeepSeek V4 Flash、SenseNova 6.7 Flash-Lite、Perplexity PC等新品聚焦“小参数、低能耗、端侧跑”,通过架构剪枝、稀疏注意力与原生多模态设计,把大模型能力塞进笔记本与眼镜,预示AI进入“去云端”时代。
2026-05-06
硬件与系统生态变局
OpenAI智能体手机提前至2027量产,苹果iOS27将允第三方AI模型接入系统功能,三星官宣AI眼镜,Chrome悄悄推送4GB端侧模型——软硬一体成为新战场,模型厂商向下游硬件与OS延伸以锁定入口。
2026-05-03
端侧AI轻量化落地
腾讯混元开源440M手机离线翻译模型,通过极致量化在低端芯片上实现超谷歌的翻译质量,标志着大模型“瘦身”技术成熟,将加速出境、IoT、隐私敏感场景的端侧AI普及。
2026-05-02
端侧与离线模型突破
腾讯开源 440MB Hy-MT 1.25bit 量化翻译模型,手机离线支持 33 种语言 1056 个方向,性能超谷歌;北大开源统一世界模型框架,一套代码覆盖多模态推理与 3D 生成,显示国产模型在端侧与通用性上的双重跃迁。
2026-05-01
多模态大模型竞速
DeepSeek灰度视觉版、谷歌DeepMind研究智能体、腾讯混元CL-bench等密集发布,图文理解、深度研究、端侧400B模型上线,多模态能力成为下一代模型标配,拉开“全能模型”竞争帷幕。
2026-05-01
AI硬件与原生新品潮
AI硬件+原生应用爆发:中国团队硅谷峰会发布三款具身新品,本地可跑Privacy Filter,iPhone跑400B大模型,AI Native硬件与轻量化推理框架让“模型即产品”快速落地消费级场景。
2026-04-30
AI硬件场景化落地加速
钉钉AI录音卡片、苹果AI眼镜、一加Ace 6至尊版等硬件集中发布,将大模型能力嵌入录音、穿搭、游戏等细分场景,显示AI硬件正从“炫技”走向“刚需”,推动端侧算力与模型轻量化同步演进。
2026-04-12
端侧高效视觉Transformer
CARE Transformer以非对称解耦架构在iPhone/iPad实现超低延迟高精度,突破端侧视觉Transformer效率瓶颈,为移动AI落地提供新范式,入选CVPR'25。
2026-04-04
多模态原生统一架构
谷歌、商汤、美团等头部厂商集体转向“原生多模态”统一Token架构,把图像、语音、文本当作同一序列预测,彻底抛弃拼接式方案。Gemma 4、NEO-unify、Wan2.7等模型先后落地,端侧可跑、性能越级,标志多模态技术进入“统一输入-统一输出”新范式,将重塑模型设计、算力需求与下游应用标准。
2026-04-02
端侧AI与硬件融合
中兴-字节豆包AI手机定档Q2,千问AI眼镜OTA升级同传克隆,联想宣布两年千亿营收目标并转型AI原生公司,终端厂商把大模型塞进每一台设备,AI硬件进入规模化落地期。
2026-04-01
端侧AI与硬件融合加速
联想宣布全面转型AI原生公司并推出0.65L AI迷你主机,苹果iOS 27将内置AI纠错键盘,Meta升级Ray-Ban智能眼镜支持多度数定制,显示AI正从云端下沉到终端,硬件重构成为新战场。
2026-03-26
大模型高效压缩突破
谷歌TurboQuant将KV缓存压缩6倍实现模型瘦身而不掉点,引发内存股大跌;苹果同步用知识蒸馏把Gemini浓缩进iPhone端侧,蚂蚁F2LLM-v2以1/10参数横扫MTEB十一项冠军,显示“大模型小型化”正成为性能与成本的新战场。