2025-07-10
端侧小模型爆发
vivo发布3B多模态模型BlueLM-2.5,可在手机端理解GUI界面;微软Phi-4-mini推理提速10倍,笔记本可跑;港大&字节4B数学模型用RL逼近235B性能。小参数+高能力+本地部署,降低推理成本与隐私风险,为移动、IoT、边缘计算打开增量市场。
2025-05-05
小模型推理革命
微软Phi-4系列以≤14B参数实现媲美甚至超越大模型的数学与推理表现,3.8B版本即可击败DeepSeek-R1蒸馏8B,宣告“本地可跑”的高性能时代到来,将重塑端侧AI、边缘部署与成本结构,引发模型瘦身与高效训练新赛道。
2025-05-02
超长上下文与高效推理突破
英伟达与UIUC把Llama上下文扩至400万token创SOTA;微软Phi-4系列以小参数量逼近GPT-4o推理表现;LoRA冗余研究称可剪枝95%参数不降性能,推动端侧与低成本部署。
2025-03-01
多模态小模型突破
微软发布56亿参数Phi-4-multimodal,在读图推理上超越GPT-4o;港科大等验证语音合成Scaling Law,小参数模型实现高性能,边缘部署前景广阔。
2024-12-21
合成数据与训练新范式
微软Phi-4预训练采用40%合成数据,14B参数模型逼近70B效果;DeepMind提出逆向思维微调提升LLM推理能力,显示高质量合成数据与新型训练策略正成为突破Scaling Law的重要方向。
2024-12-14
小模型逆袭与大模型效率战
微软 Phi-4(14B)数学击败 GPT-4o,Cohere 推出可跑低端设备的 Command R7B,显示“小模型+数据/训练算法创新”正在挑战“唯参数论”。效率竞赛降低算力门槛,利好端侧部署与中小企业,可能重塑云端订阅商业模式。