AI快开门

发现最好的AI工具

2025-09-18

端侧小模型与推理优化潮

Meta发布MobileLLM-R1瞄准手机端小型推理,Groq融资7.5亿美元推超高速芯片,Ring-mini-2.0以1B参数超10B性能,显示“小而强”模型+专用硬件正成为边缘AI新趋势。
2025-08-08

开源与端侧模型提速

小红书开源dots.vlm1、Qwen推4B端侧推理模型、GPT-oss社区版等相继亮相,在树莓派可跑的256k长文本模型与多模态能力逼近SOTA,反映“小型化+开源”正成为对冲闭源旗舰的新趋势。
2024-02-10

模型小型化与MoE架构突破

北大、腾讯等推出的3B MoE-LLaVA以更少激活参数媲美7B稠密模型,Sebastian Raschka指出“大模型变小”已成年度趋势,模型合并+MoE成为主流方案,预示端侧部署与低成本推理将加速落地。