2025-11-06
端侧AI入口争夺战
苹果年付10亿美元引入Gemini重塑Siri,QQ浏览器、美团、中兴Nebula小模型竞逐手机“AI超级入口”。轻量模型+系统级Agent将决定下一轮换机周期与流量再分配。
2025-08-15
超小模型端侧爆发
谷歌Gemma 3 270M、西班牙“苍蝇脑”94M、国产MoE等<1B参数模型密集开源,可在手机/手表/家电离线流畅运行,标志端侧AI进入“轻量可用”阶段,将重塑IoT与消费电子成本结构。
2025-08-11
算法与算力底层创新
清华团队打破40年Dijkstra最优性神话,新最短路径算法登STOC最佳;谷歌DeepMind Perch 2.0刷新1.5万物种生物声学SOTA;MoE超级专家机制、Kitten 1500万参数TTS等轻量模型涌现,显示底层算法与架构创新仍在加速。
2025-05-22
开源编程模型轻量革命
Mistral Devstral、何恺明MeanFlow等开源模型实现单卡/笔记本级推理,一步生成代码或图像,无需预训练与蒸馏,打破“大参数+高算力”垄断,降低开发者与中小企业落地门槛,将重塑边缘AI与本地创作工具链。
2025-05-04
长视频理解突破
Video-XL-Pro仅用3B参数在长视频大海捞针任务中准确率超98%,性能反超7B级模型,证明轻量模型通过架构创新可解决长时序依赖与显存瓶颈,为实时视频分析、监控、教育等场景落地打开空间。
2024-10-25
端侧轻量模型爆发
Meta、谷歌、Cohere等接连发布量化或超轻量模型,Llama 3.2 1B/3B速度翻倍、体积减半,Zamba2-7B推理效率再提升20%,Aya Expanse以小胜大。边缘部署门槛骤降,将加速手机、IoT及消费级硬件的AI普惠。
2024-06-19
多模态与轻量模型竞速
Meta Chameleon、JASCO、AudioSeal、Snap轻量AR模型、B站Index-1.9B等同时亮相,显示“多模态融合+端侧可跑”成为新赛点,降低开发者门槛,加速AI下沉到手机、可穿戴与边缘设备。
2024-02-23
谷歌Gemma开源颠覆生态
谷歌突然发布2B/7B轻量级开源模型Gemma,性能碾压同尺寸Llama 2,笔记本可跑且允许商用,同步开放权重与HF生态,直接重燃开源大模型竞争,降低企业私有化门槛。