2025-09-18
端侧小模型与推理优化潮
Meta发布MobileLLM-R1瞄准手机端小型推理,Groq融资7.5亿美元推超高速芯片,Ring-mini-2.0以1B参数超10B性能,显示“小而强”模型+专用硬件正成为边缘AI新趋势。
2025-08-08
开源与端侧模型提速
小红书开源dots.vlm1、Qwen推4B端侧推理模型、GPT-oss社区版等相继亮相,在树莓派可跑的256k长文本模型与多模态能力逼近SOTA,反映“小型化+开源”正成为对冲闭源旗舰的新趋势。