2024-09-06
终端侧AI加速落地
高通、微软、面壁智能等推终端侧大模型与NPU方案,Phi-3.5、MiniCPM 3.0可在2GB内存手机运行,预示AI本地化体验进入实用阶段。
2024-06-18
小模型高效化与推理优化
微软Phi-3、DCFormer、MCTSr-8B、TransNAR等研究通过动态注意力、算法推理大脑、蒙特卡洛搜索等机制,在参数量<10B情况下逼近甚至超越GPT-4奥数与推理表现,为端侧部署、低成本AGI提供新范式。
2024-05-07
大模型轻量化与端侧落地
Phi-3-mini、Llama-3 1M上下文、量化压缩等突破,让百亿级模型在手机、PC端实时运行,端侧AI进入可用时代,将重塑应用生态与成本结构。
2024-05-04
小模型数据污染危机
多项研究指出,微软Phi-3、Mixtral 8x22B等热门小模型存在严重数据污染与过拟合,三分之二评测集被混入训练数据,导致性能虚高,引发社区对小型模型可信度的重新审视。