小模型 - AI话题 - AI快开门

2026-03-29

大模型物理推理与机器人新范式

视频生成大模型隐式习得物理规律，被首次系统迁移到机器人操控任务，仅用732M参数即超越7B模型，显著降低对人工演示数据的依赖，为“数据困境”提供突破口，标志着“预训练物理先验+小参数策略”成为机器人学的新主流路线。

视频预训练物理先验机器人操控数据效率小模型

2026-03-18

后Scaling时代模型效率革命

OpenAI、MiniMax、月之暗面等密集发布轻量化或自迭代模型，标志行业从堆算力转向拼Token效率与自我进化，降低门槛并加速落地。

小模型自进化 Token效率后Scaling 模型压缩

2026-03-09

小模型逆袭大模型

阿里通义千问Qwen3.5-4B仅用2%参数（40亿）在第三方评测中打平甚至超越千亿级GPT-4o，开启“以小博大”新范式；BOSS直聘3B模型海外病毒式传播，性能对标32B；UniPat AI开源30B科研模型硬刚Gemini、Claude，48小时GitHub揽星9.5k。参数效率革命降低本地部署成本，为端侧和中小企业带来普惠AI能力。

小模型参数效率端侧部署通义千问模型压缩

2026-01-31

小模型与产品市场契合

蚂蚁8B小模型跨任务构建用户“话”像达SOTA，Manus万字拆解示范PMF真谛，挑战“唯大参数”叙事，提示行业回归场景与成本效率。

小模型 PMF 用户画像 Manus

2026-01-21

端侧小模型突破

Liquid AI 1.2B推理模型仅900MB内存即可在手机离线运行“思考”模式，非Transformer架构的液态神经网络与英伟达ToolOrchestra小模型调度框架共同验证：小参数+高效工具调用可在端侧实现接近大模型的推理与Agent能力，端侧AI临界点已至。

端侧推理液态神经网络小模型 ToolOrchestra 离线AI

2025-12-14

小模型高效革命

英伟达80亿参数Orchestrator以30%预算在困难任务获37%成绩，阶跃星辰8B框架解锁百万token测试时计算，苹果、OpenAI亦开源稀疏化小模型。通过“小脑指挥大脑”与动态推理，小参数模型在边缘与实时场景逼近大模型性能，显著降低算力与能耗门槛。

小模型稀疏化测试时计算边缘部署降本增效

2025-12-09

开源小模型协作范式

英伟达开源8B模型当“指挥家”调度工具链，智谱开源9B轻量版GLM-4.6V支持商用，小参数+工具调用+强化学习成为性价比新范式，降低AI落地成本。

开源小模型工具调用英伟达智谱

2025-12-08

小模型逆袭与推理优化

英伟达、腾讯、DeepMind等接连发布8B-406B参数的小/中模型，通过工具调度、推理优化在单任务成本、速度上碾压GPT-5，显示“小而精”路线正重塑大模型竞争规则，降低落地门槛。

小模型推理优化成本英伟达腾讯混元

2025-11-20

小模型逆袭与架构革新

微博15亿参数VibeThinker数学基准反超6710亿DeepSeek-R1；何恺明团队提出无Tokenizer扩散范式，Just Image Transformers简化生成链路；蚂蚁OceanBase三行代码构建AI应用，显示“小即美”与架构简化正成为新趋势。

小模型扩散模型 Tokenizer 架构简化 OceanBase

2025-10-29

模型效率与小型化突破

清华&快手SVG扩散模型训练提速6200%、生成提速3500%，IBM Granite 4.0 Nano刷新小模型性能极限，中科院PARO用1/10思维链数据达全量效果，后训练时代“小而快”成为新赛道。

小模型 SVG扩散 IBM Granite 训练效率

2025-10-18

高效推理与模型协作框架

R-Stitch动态拼接、北航-浙大4倍提速、EXO Lab Mac Studio 2.77倍加速等方案，通过“大小模型协同”“消费级硬件分布式”降低推理成本，缓解算力焦虑。技术路线已获学术与工程双重验证，预示云端与边缘混合部署将成为大模型落地标配。

高效推理大小模型协同边缘计算分布式推理 R-Stitch

2025-10-13

多模态小模型性能跃迁

抖音&LV-NUS开源SAIL-VL2、清华团队发布GAGA-1，8B参数在复杂推理与口型同步视频生成上比肩GPT-4o，证明小模型通过数据与架构优化即可实现大模型级体验。

SAIL-VL2 GAGA-1 多模态小模型口型同步性能比肩GPT-4o

2025-09-29

国产小模型逆袭与高效训练

北大-360 的 32B TinyR1、陈丹琦 8B RLMT、LiquidAI Nanos 等轻量模型通过算法创新在安全、推理、边缘端任务上超越千亿级巨兽，验证“小即美”路线，降低算力门槛，推动端侧部署与私有化落地。

小模型高效训练边缘AI 私有化算法创新

2025-09-13

小模型长工具链与搜索Agent突破

MiniMax&港科大提出WebExplorer，用高质量数据让8B小模型完成100轮工具调用，复杂长搜索任务反超大模型；Meta开源MobileLLM-R1以<1B参数击败Qwen3，验证“数据>参数”的新范式，推动端侧Agent落地。

WebExplorer MobileLLM-R1 小模型工具调用搜索Agent

2025-08-20

小模型与边缘AI崛起

英伟达开源9B Nemotron Nano v2，速度超Qwen3六倍，专为手表/车载等边缘端优化；康奈尔推出“微波大脑”芯片，176毫瓦实现75%推理准确率。边缘AI在成本、功耗、隐私侧优势凸显，预示“大模型上云、小模型落地”的混合部署时代加速到来。

小模型 Nemotron Nano 边缘AI 微波芯片低功耗

2025-08-19

小模型Agent效率革命

英伟达、清华、字节等机构同步论证：6-9B小模型在智能体任务中性价比远超千亿大模型；Nemotron-Nano-9B、MiniCPM-V 4.0、M3-Agent等轻量方案支持端侧部署与百Agent并行，预示“小参数+高并发”将成Agent落地主流。

小模型智能体端侧并发性价比

2025-08-10

机器人与具身智能热潮

世界机器人大会集中展示国产人形机器人最新进展，腾讯张正友提出具身智能必须回答“真任务、真环境、真物理”三大问题，加上27M小模型在推理性能上超越o3-mini的案例，显示轻量级模型与实体结合正成为新热点。

人形机器人具身智能小模型世界模型轻量推理

2025-06-30

端侧/小模型提速

腾讯Hunyuan-A13B、华为盘古7B/72B及2700万参数推理模型相继开源，小尺寸+高性能路线降低部署成本，为端侧与私域场景提供新选择。

小模型端侧开源盘古 Hunyuan

2025-06-11

推理模型开源竞速

法国Mistral、阿里MaskSearch、清华&面壁MiniCPM等相继开源强推理模型或框架，量化版DeepSeek-R1以1.93bit在编程任务击败Claude 4 Sonnet，MiniCPM 4以0.5B参数拿下端侧SOTA，标志着“小模型+高推理”路线成为开源社区新焦点，降低硬件门槛并冲击闭源优势。

开源推理小模型 DeepSeek MiniCPM 编程能力

2025-06-10

端侧与高效小模型崛起

“小模型+高效推理”成为新赛道：清华&面壁0.5B模型端侧SOTA，4090可跑；Adobe单卡4090实现实时视频生成；港科大-快手进化搜索让小模型作画媲美大模型；Prot42仅依赖序列即可8k长程建模蛋白质。低算力需求+本地部署，将加速AI在移动、IoT、生物设计等场景渗透。

端侧模型小模型实时生成蛋白质设计算力优化

# 小模型