2025-12-20
谷歌全面反击OpenAI
2025年谷歌凭Gemini 3 Pro/Flash与端侧小模型反超OpenAI,将AI深度嵌入搜索、安卓、广告,并联合美国能源部启动“国家AI创世纪计划”,24家巨头共建国家级算力与科研生态,标志硅谷—白宫协同进入战略级竞争阶段,重塑全球大模型权力版图。
2025-12-05
AI硬件新物种扎堆
理想1699元AI眼镜、戴森5499元真AI清洁机器人、可灵数字人2.0、KlingAI Avatar 2.0“5分钟唱跳”等硬件/数字人产品密集上市,结合端侧模型与空间计算,把大模型能力装进眼镜、家电与虚拟偶像,开启“模型即硬件”平价消费时代。
2025-12-01
终端AI Agent落地
豆包手机助手、阶跃GELab-Zero、Win11 Copilot等把大模型装进手机与PC,实现GUI自动操作、本地任务流闭环,标志“模型即系统”时代到来,硬件厂商、OS厂商话语权重新洗牌。
2025-10-11
端侧小模型与手机AI创新
Liquid AI发布8B参数仅激活1.5B的LFM2-8B-A1B,手机跑出4B级速度;vivo首发AIOS,Chrome/Gemini嵌入智能网购,显示“轻量化+场景化”正成为端侧AI竞争新焦点,推动个人智能体验升级。
2025-09-18
端侧小模型与推理优化潮
Meta发布MobileLLM-R1瞄准手机端小型推理,Groq融资7.5亿美元推超高速芯片,Ring-mini-2.0以1B参数超10B性能,显示“小而强”模型+专用硬件正成为边缘AI新趋势。
2025-09-03
端侧与消费级AI加速落地
苹果开源FastVLM、MobileCLIP2实现85倍速度提升,Liquid AI推出手机视觉语言模型LFM2-VL,字节Seed新注意力机制让长视频生成计算量降85%,端侧算力与模型协同优化进入实用阶段。
2025-08-16
端侧超小模型爆发
谷歌开源0.27B Gemma 3、4B Jan-v1等“小钢炮”模型,可在浏览器或手机本地运行,性能对标数十亿参数大模型,标志端侧AI进入实用阶段,将重塑移动应用、IoT与隐私计算生态。
2025-08-09
轻量多模态模型竞速开源
小米、面壁智能相继开源7B与4B多模态大模型,手机端可流畅运行,并配套发布推理部署CookBook,降低开发者落地门槛,标志着“小参数+高效果”成为国产大模型新赛道,加速端侧AI生态繁荣。
2025-07-10
端侧小模型爆发
vivo发布3B多模态模型BlueLM-2.5,可在手机端理解GUI界面;微软Phi-4-mini推理提速10倍,笔记本可跑;港大&字节4B数学模型用RL逼近235B性能。小参数+高能力+本地部署,降低推理成本与隐私风险,为移动、IoT、边缘计算打开增量市场。
2025-07-02
消费级AI应用付费困境
Menlo Ventures报告显示全球18亿AI用户仅3%愿付费,百度搜索十年最大改版、微信AI搜索“开盒”争议、荣耀端侧语音大模型上线,揭示C端AI产品仍处“高流量、低变现”阶段,商业模式探索迫在眉睫。
2025-06-24
端侧小模型与本地AI爆发
微软3.3亿参数Mu、Gemini Robotics On-Device等轻量级模型把推理搬至本地,降低延迟与隐私风险;Windows 11、机器人、智能汽车等场景同步落地,预示“大模型瘦身+端侧算力”成为新基础设施。
2025-06-10
端侧与高效小模型崛起
“小模型+高效推理”成为新赛道:清华&面壁0.5B模型端侧SOTA,4090可跑;Adobe单卡4090实现实时视频生成;港科大-快手进化搜索让小模型作画媲美大模型;Prot42仅依赖序列即可8k长程建模蛋白质。低算力需求+本地部署,将加速AI在移动、IoT、生物设计等场景渗透。
2025-06-10
苹果WWDC25 AI矩阵
苹果WWDC25发布Xcode 26内置ChatGPT、开放本地Foundation Models、Spotlight升级为AI操作平台,但万众期待的AI Siri缺席。端侧模型全面开放意味着iOS生态将迎第三方AI应用爆发,而Siri跳票显示苹果在对话Agent领域仍落后于OpenAI/Google,市场反应股价6分钟蒸发750亿。
2025-02-10
多模态与端侧模型
Meta推出MILS让LLM零样本处理多媒体;谷歌Imagen3 API降至0.03美元/张;微软LLaVA-Rad仅小参数量即可生成精准放射报告;北航TinyLLaVA-Video在受限算力下超越部分7B模型,多模态能力快速下沉到边缘设备。
2024-12-17
端侧全模态模型崛起
无问芯穹Megrez-3B-Omni、Meta Apollo等轻量级模型实现图文音三模态本地推理,速度提升3倍且无需联网。端侧全模态能力将AI交互从文字升级到“看听说”一体,为手机、眼镜、车载等低功耗设备打开实时翻译、情境搜索、情感陪护等新场景,加速边缘AI生态成熟。
2024-12-16
多模态小模型爆发
DeepSeek-VL2、Megrez-3B-Omni、Stable Zero123等3B-27B参数级模型在端侧实现图文音3D全模态理解与生成,速度提升3倍+,显存减半。标志着“大模型做小”成为新赛道,将加速手机、机器人、车载等边缘场景落地。
2024-12-11
端侧与专业模型融资潮
面壁智能获数亿元融资押注端侧大模型,Speak估值破10亿美元深耕语言学习,HarperCollins、Spotify布局AI有声读物,资本持续追捧垂直场景与边缘部署。
2024-11-30
端侧与多模态模型开源潮
智谱AI开源GLM-Edge端侧大语言及多模态系列,腾讯文档3.9.0升级AI助手,标志国产模型向轻量化、场景化落地提速,降低开发者门槛,加速边缘AI生态繁荣。
2024-10-24
端侧小模型与边缘AI
Mistral推出3B/8B Ministral系列,高通联合Mistral将生成式模型塞进手机;OPPO发布系统级AI ColorOS 15,小模型在边缘端性能超越Llama 3,预示“云-边-端”混合部署成为新主流,降低延迟与成本。
2024-10-19
端侧小模型与推理加速
Mistral发布3B/8B端侧专用模型Ministral,以3B参数超7B性能;英特尔与Hugging Face推出动态推测解码,最高2.7倍速生成;清华8比特量化Attention实现2倍于FlashAttention-2的加速,标志着边缘AI进入高效可用新阶段。