2026-03-29

大模型物理推理与机器人新范式

视频生成大模型隐式习得物理规律,被首次系统迁移到机器人操控任务,仅用732M参数即超越7B模型,显著降低对人工演示数据的依赖,为“数据困境”提供突破口,标志着“预训练物理先验+小参数策略”成为机器人学的新主流路线。
2026-03-18

后Scaling时代模型效率革命

OpenAI、MiniMax、月之暗面等密集发布轻量化或自迭代模型,标志行业从堆算力转向拼Token效率与自我进化,降低门槛并加速落地。
2026-03-09

小模型逆袭大模型

阿里通义千问Qwen3.5-4B仅用2%参数(40亿)在第三方评测中打平甚至超越千亿级GPT-4o,开启“以小博大”新范式;BOSS直聘3B模型海外病毒式传播,性能对标32B;UniPat AI开源30B科研模型硬刚Gemini、Claude,48小时GitHub揽星9.5k。参数效率革命降低本地部署成本,为端侧和中小企业带来普惠AI能力。
2026-01-31

小模型与产品市场契合

蚂蚁8B小模型跨任务构建用户“话”像达SOTA,Manus万字拆解示范PMF真谛,挑战“唯大参数”叙事,提示行业回归场景与成本效率。
2026-01-21

端侧小模型突破

Liquid AI 1.2B推理模型仅900MB内存即可在手机离线运行“思考”模式,非Transformer架构的液态神经网络与英伟达ToolOrchestra小模型调度框架共同验证:小参数+高效工具调用可在端侧实现接近大模型的推理与Agent能力,端侧AI临界点已至。
2025-12-14

小模型高效革命

英伟达80亿参数Orchestrator以30%预算在困难任务获37%成绩,阶跃星辰8B框架解锁百万token测试时计算,苹果、OpenAI亦开源稀疏化小模型。通过“小脑指挥大脑”与动态推理,小参数模型在边缘与实时场景逼近大模型性能,显著降低算力与能耗门槛。
2025-12-09

开源小模型协作范式

英伟达开源8B模型当“指挥家”调度工具链,智谱开源9B轻量版GLM-4.6V支持商用,小参数+工具调用+强化学习成为性价比新范式,降低AI落地成本。
2025-12-08

小模型逆袭与推理优化

英伟达、腾讯、DeepMind等接连发布8B-406B参数的小/中模型,通过工具调度、推理优化在单任务成本、速度上碾压GPT-5,显示“小而精”路线正重塑大模型竞争规则,降低落地门槛。
2025-11-20

小模型逆袭与架构革新

微博15亿参数VibeThinker数学基准反超6710亿DeepSeek-R1;何恺明团队提出无Tokenizer扩散范式,Just Image Transformers简化生成链路;蚂蚁OceanBase三行代码构建AI应用,显示“小即美”与架构简化正成为新趋势。
2025-10-29

模型效率与小型化突破

清华&快手SVG扩散模型训练提速6200%、生成提速3500%,IBM Granite 4.0 Nano刷新小模型性能极限,中科院PARO用1/10思维链数据达全量效果,后训练时代“小而快”成为新赛道。
2025-10-18

高效推理与模型协作框架

R-Stitch动态拼接、北航-浙大4倍提速、EXO Lab Mac Studio 2.77倍加速等方案,通过“大小模型协同”“消费级硬件分布式”降低推理成本,缓解算力焦虑。技术路线已获学术与工程双重验证,预示云端与边缘混合部署将成为大模型落地标配。
2025-10-13

多模态小模型性能跃迁

抖音&LV-NUS开源SAIL-VL2、清华团队发布GAGA-1,8B参数在复杂推理与口型同步视频生成上比肩GPT-4o,证明小模型通过数据与架构优化即可实现大模型级体验。
2025-09-29

国产小模型逆袭与高效训练

北大-360 的 32B TinyR1、陈丹琦 8B RLMT、LiquidAI Nanos 等轻量模型通过算法创新在安全、推理、边缘端任务上超越千亿级巨兽,验证“小即美”路线,降低算力门槛,推动端侧部署与私有化落地。
2025-09-13

小模型长工具链与搜索Agent突破

MiniMax&港科大提出WebExplorer,用高质量数据让8B小模型完成100轮工具调用,复杂长搜索任务反超大模型;Meta开源MobileLLM-R1以<1B参数击败Qwen3,验证“数据>参数”的新范式,推动端侧Agent落地。
2025-08-20

小模型与边缘AI崛起

英伟达开源9B Nemotron Nano v2,速度超Qwen3六倍,专为手表/车载等边缘端优化;康奈尔推出“微波大脑”芯片,176毫瓦实现75%推理准确率。边缘AI在成本、功耗、隐私侧优势凸显,预示“大模型上云、小模型落地”的混合部署时代加速到来。
2025-08-19

小模型Agent效率革命

英伟达、清华、字节等机构同步论证:6-9B小模型在智能体任务中性价比远超千亿大模型;Nemotron-Nano-9B、MiniCPM-V 4.0、M3-Agent等轻量方案支持端侧部署与百Agent并行,预示“小参数+高并发”将成Agent落地主流。
2025-08-10

机器人与具身智能热潮

世界机器人大会集中展示国产人形机器人最新进展,腾讯张正友提出具身智能必须回答“真任务、真环境、真物理”三大问题,加上27M小模型在推理性能上超越o3-mini的案例,显示轻量级模型与实体结合正成为新热点。
2025-06-30

端侧/小模型提速

腾讯Hunyuan-A13B、华为盘古7B/72B及2700万参数推理模型相继开源,小尺寸+高性能路线降低部署成本,为端侧与私域场景提供新选择。
2025-06-11

推理模型开源竞速

法国Mistral、阿里MaskSearch、清华&面壁MiniCPM等相继开源强推理模型或框架,量化版DeepSeek-R1以1.93bit在编程任务击败Claude 4 Sonnet,MiniCPM 4以0.5B参数拿下端侧SOTA,标志着“小模型+高推理”路线成为开源社区新焦点,降低硬件门槛并冲击闭源优势。
2025-06-10

端侧与高效小模型崛起

“小模型+高效推理”成为新赛道:清华&面壁0.5B模型端侧SOTA,4090可跑;Adobe单卡4090实现实时视频生成;港科大-快手进化搜索让小模型作画媲美大模型;Prot42仅依赖序列即可8k长程建模蛋白质。低算力需求+本地部署,将加速AI在移动、IoT、生物设计等场景渗透。