2025-12-18
端侧与轻量化模型
苹果开源SHARP 1秒照片转3D、华科大教授揭秘手机端大模型剪枝量化技术,配合流式数据集百倍提速,端侧AI在性能与效率上双重突破,为下一代智能终端铺路。
2025-11-06
端侧AI入口争夺战
苹果年付10亿美元引入Gemini重塑Siri,QQ浏览器、美团、中兴Nebula小模型竞逐手机“AI超级入口”。轻量模型+系统级Agent将决定下一轮换机周期与流量再分配。
2025-11-02
生成式推荐系统新范式
傅聪团队提出OnePiece通用生成式推荐模型,兼顾效果与成本:相比直接拿LLM做推荐,新范式以轻量化生成式训练实现毫秒级延迟、降低50%以上推理开销,为电商、短视频、广告等高频场景的大规模落地扫清障碍,有望重塑推荐工业界技术栈。
2025-10-18
轻量化模型与端侧OCR
百度0.9B PaddleOCR-VL横扫4项SOTA并登顶Hugging Face,证明“小模型+多模态”在文档解析场景已可替代大模型,实现PC级本地部署。端侧轻量化趋势将降低开发者门槛,推动OCR、文档理解在政企、教育、金融场景快速渗透。
2025-10-11
端侧小模型与手机AI创新
Liquid AI发布8B参数仅激活1.5B的LFM2-8B-A1B,手机跑出4B级速度;vivo首发AIOS,Chrome/Gemini嵌入智能网购,显示“轻量化+场景化”正成为端侧AI竞争新焦点,推动个人智能体验升级。
2025-09-17
消费电子AI硬件潮
魅族AI眼镜StarV Snap仅39g支持拍照翻译支付,中国移动发布“灵犀”电子导盲犬,华为4+10+N方案打通中小企业智能化最后一公里,轻量级AI硬件正走向随身、助残与B端落地。
2025-08-18
大模型技术突破与开源
国内外头部厂商密集发布新一代大模型:百度GenFlow2.0生成速度提升10倍,谷歌开源0.27B Gemma 3以“小模型”思路缓解算力焦虑,Meta推出无监督DINOv3,上交&UCSD开源扩散大模型D2F吞吐量超LLaMA3。技术路线呈现“轻量化+开源”趋势,降低开发者门槛,加速生态繁荣。
2025-08-17
大模型轻量化与量化突破
北大提出首个复数域2比特大模型iFairy,把权重压缩到1/8且推理仅需加减法,手机可跑;Meta开源70亿参数DINOv3,自监督视觉模型刷新SOTA。两者共同标志“大模型小型化”进入实用拐点,为端侧部署、低成本落地打开空间。
2025-08-15
超小模型端侧爆发
谷歌Gemma 3 270M、西班牙“苍蝇脑”94M、国产MoE等<1B参数模型密集开源,可在手机/手表/家电离线流畅运行,标志端侧AI进入“轻量可用”阶段,将重塑IoT与消费电子成本结构。
2025-08-11
算法与算力底层创新
清华团队打破40年Dijkstra最优性神话,新最短路径算法登STOC最佳;谷歌DeepMind Perch 2.0刷新1.5万物种生物声学SOTA;MoE超级专家机制、Kitten 1500万参数TTS等轻量模型涌现,显示底层算法与架构创新仍在加速。
2025-08-10
机器人与具身智能热潮
世界机器人大会集中展示国产人形机器人最新进展,腾讯张正友提出具身智能必须回答“真任务、真环境、真物理”三大问题,加上27M小模型在推理性能上超越o3-mini的案例,显示轻量级模型与实体结合正成为新热点。
2025-08-04
开源大模型密集上新
问小白XBai o4、腾讯混元0.5-7B、谷歌langextract、昆仑万维MindLink等相继开源,覆盖推理、轻量部署与结构化抽取,标志国内开源阵营向OpenAI闭源模型发起正面性能与生态挑战,降低行业落地门槛。
2025-06-27
开源多模态小模型潮
谷歌Gemma 3n、腾讯混元-A13B、北大RewardAnything等密集开源,2B-13B参数即可本地部署,多模态+工具调用+长文本能力逼近云端大模型,标志“边缘AI”进入可用阶段,降低开发者门槛,催化端侧应用爆发。
2025-06-23
教育专用大模型轻量化
网易有道开源14B参数“子曰3”,以低成本实现数学推理超越更大模型,为教育普惠提供轻量高性能方案,带动AI教辅、公平化学习新趋势。
2025-06-03
超长视频理解模型突破
智源研究院开源Video-XL-2,单卡即可处理万帧级超长视频,刷新轻量级视频理解极限,为实时剪辑、安防、教育等场景降本增效,标志长视频AI进入普惠阶段。
2025-05-22
开源编程模型轻量革命
Mistral Devstral、何恺明MeanFlow等开源模型实现单卡/笔记本级推理,一步生成代码或图像,无需预训练与蒸馏,打破“大参数+高算力”垄断,降低开发者与中小企业落地门槛,将重塑边缘AI与本地创作工具链。
2025-05-04
长视频理解突破
Video-XL-Pro仅用3B参数在长视频大海捞针任务中准确率超98%,性能反超7B级模型,证明轻量模型通过架构创新可解决长时序依赖与显存瓶颈,为实时视频分析、监控、教育等场景落地打开空间。
2025-04-21
轻量化与端侧AI突围
微软BitNet b1.58 2B4T、Intel AI Playground、Gemma 3 QAT等原生低比特模型开源,0.4GB内存+单CPU即可跑2B参数,性能媲美全精度;Arc核显、3090消费级显卡成为边缘AI新算力,推动PC、智能音箱、IoT设备本地跑大模型,降低云成本与隐私风险,加速AI普惠。
2025-04-18
端侧 AI 与硬件加速
微软 1-bit BitNet 仅 0.4GB 内存跑 2B 模型,联发科天玑 9400+ 提出 AGENTIC AI UX,RTX 5060 Ti 凭 DLSS 4 本地跑 32B 大模型,显示“手机+PC”端侧轻量化部署进入实用阶段。