2025-12-14
小模型高效革命
英伟达80亿参数Orchestrator以30%预算在困难任务获37%成绩,阶跃星辰8B框架解锁百万token测试时计算,苹果、OpenAI亦开源稀疏化小模型。通过“小脑指挥大脑”与动态推理,小参数模型在边缘与实时场景逼近大模型性能,显著降低算力与能耗门槛。
2025-12-09
开源小模型协作范式
英伟达开源8B模型当“指挥家”调度工具链,智谱开源9B轻量版GLM-4.6V支持商用,小参数+工具调用+强化学习成为性价比新范式,降低AI落地成本。
2025-12-08
小模型逆袭与推理优化
英伟达、腾讯、DeepMind等接连发布8B-406B参数的小/中模型,通过工具调度、推理优化在单任务成本、速度上碾压GPT-5,显示“小而精”路线正重塑大模型竞争规则,降低落地门槛。
2025-11-20
小模型逆袭与架构革新
微博15亿参数VibeThinker数学基准反超6710亿DeepSeek-R1;何恺明团队提出无Tokenizer扩散范式,Just Image Transformers简化生成链路;蚂蚁OceanBase三行代码构建AI应用,显示“小即美”与架构简化正成为新趋势。
2025-10-29
模型效率与小型化突破
清华&快手SVG扩散模型训练提速6200%、生成提速3500%,IBM Granite 4.0 Nano刷新小模型性能极限,中科院PARO用1/10思维链数据达全量效果,后训练时代“小而快”成为新赛道。
2025-10-18
高效推理与模型协作框架
R-Stitch动态拼接、北航-浙大4倍提速、EXO Lab Mac Studio 2.77倍加速等方案,通过“大小模型协同”“消费级硬件分布式”降低推理成本,缓解算力焦虑。技术路线已获学术与工程双重验证,预示云端与边缘混合部署将成为大模型落地标配。
2025-10-13
多模态小模型性能跃迁
抖音&LV-NUS开源SAIL-VL2、清华团队发布GAGA-1,8B参数在复杂推理与口型同步视频生成上比肩GPT-4o,证明小模型通过数据与架构优化即可实现大模型级体验。
2025-09-29
国产小模型逆袭与高效训练
北大-360 的 32B TinyR1、陈丹琦 8B RLMT、LiquidAI Nanos 等轻量模型通过算法创新在安全、推理、边缘端任务上超越千亿级巨兽,验证“小即美”路线,降低算力门槛,推动端侧部署与私有化落地。
2025-09-13
小模型长工具链与搜索Agent突破
MiniMax&港科大提出WebExplorer,用高质量数据让8B小模型完成100轮工具调用,复杂长搜索任务反超大模型;Meta开源MobileLLM-R1以<1B参数击败Qwen3,验证“数据>参数”的新范式,推动端侧Agent落地。
2025-08-20
小模型与边缘AI崛起
英伟达开源9B Nemotron Nano v2,速度超Qwen3六倍,专为手表/车载等边缘端优化;康奈尔推出“微波大脑”芯片,176毫瓦实现75%推理准确率。边缘AI在成本、功耗、隐私侧优势凸显,预示“大模型上云、小模型落地”的混合部署时代加速到来。
2025-08-19
小模型Agent效率革命
英伟达、清华、字节等机构同步论证:6-9B小模型在智能体任务中性价比远超千亿大模型;Nemotron-Nano-9B、MiniCPM-V 4.0、M3-Agent等轻量方案支持端侧部署与百Agent并行,预示“小参数+高并发”将成Agent落地主流。
2025-08-10
机器人与具身智能热潮
世界机器人大会集中展示国产人形机器人最新进展,腾讯张正友提出具身智能必须回答“真任务、真环境、真物理”三大问题,加上27M小模型在推理性能上超越o3-mini的案例,显示轻量级模型与实体结合正成为新热点。
2025-06-30
端侧/小模型提速
腾讯Hunyuan-A13B、华为盘古7B/72B及2700万参数推理模型相继开源,小尺寸+高性能路线降低部署成本,为端侧与私域场景提供新选择。
2025-06-11
推理模型开源竞速
法国Mistral、阿里MaskSearch、清华&面壁MiniCPM等相继开源强推理模型或框架,量化版DeepSeek-R1以1.93bit在编程任务击败Claude 4 Sonnet,MiniCPM 4以0.5B参数拿下端侧SOTA,标志着“小模型+高推理”路线成为开源社区新焦点,降低硬件门槛并冲击闭源优势。
2025-06-10
端侧与高效小模型崛起
“小模型+高效推理”成为新赛道:清华&面壁0.5B模型端侧SOTA,4090可跑;Adobe单卡4090实现实时视频生成;港科大-快手进化搜索让小模型作画媲美大模型;Prot42仅依赖序列即可8k长程建模蛋白质。低算力需求+本地部署,将加速AI在移动、IoT、生物设计等场景渗透。
2025-05-31
小模型高效协同范式成型
10个7B模型并联无额外训练即可在多项任务上跑赢GPT-4.1,TON选择性推理把推理长度砍90%准确率反增17%,阿里通义“推理+搜索”框架让小模型在开放域问答媲美大模型,预示“小而精”成为普惠AI新主流。
2025-05-05
小模型推理革命
微软Phi-4系列以≤14B参数实现媲美甚至超越大模型的数学与推理表现,3.8B版本即可击败DeepSeek-R1蒸馏8B,宣告“本地可跑”的高性能时代到来,将重塑端侧AI、边缘部署与成本结构,引发模型瘦身与高效训练新赛道。
2025-05-01
数学与推理模型突破
DeepSeek-Prover-V2、Mona微调、浙大vivo一次示范终身掌握等成果,显示小参数模型在数学证明、复杂操作、终身学习上实现“大模型做不到”的新技能。推理侧Scaling Law后训练化,为端侧、教育、科研场景提供低成本高性能方案,国产小模型有望率先在奥数辅导、自动定理证明等 niche 市场商业化落地。
2025-04-26
小参数高效数学推理突破
英伟达1.5B模型在AIMO2奥赛击败14B级对手,验证“小模型+强数据”路线可行,开源OpenMath-Nemotron系列,为端侧数学推理、教育普惠与科研降本树立新标杆,陶哲轩公开点赞。