2025-12-18
端侧与轻量化模型
苹果开源SHARP 1秒照片转3D、华科大教授揭秘手机端大模型剪枝量化技术,配合流式数据集百倍提速,端侧AI在性能与效率上双重突破,为下一代智能终端铺路。
2025-11-02
生成式推荐系统新范式
傅聪团队提出OnePiece通用生成式推荐模型,兼顾效果与成本:相比直接拿LLM做推荐,新范式以轻量化生成式训练实现毫秒级延迟、降低50%以上推理开销,为电商、短视频、广告等高频场景的大规模落地扫清障碍,有望重塑推荐工业界技术栈。
2025-10-18
轻量化模型与端侧OCR
百度0.9B PaddleOCR-VL横扫4项SOTA并登顶Hugging Face,证明“小模型+多模态”在文档解析场景已可替代大模型,实现PC级本地部署。端侧轻量化趋势将降低开发者门槛,推动OCR、文档理解在政企、教育、金融场景快速渗透。
2025-10-11
端侧小模型与手机AI创新
Liquid AI发布8B参数仅激活1.5B的LFM2-8B-A1B,手机跑出4B级速度;vivo首发AIOS,Chrome/Gemini嵌入智能网购,显示“轻量化+场景化”正成为端侧AI竞争新焦点,推动个人智能体验升级。
2025-08-18
大模型技术突破与开源
国内外头部厂商密集发布新一代大模型:百度GenFlow2.0生成速度提升10倍,谷歌开源0.27B Gemma 3以“小模型”思路缓解算力焦虑,Meta推出无监督DINOv3,上交&UCSD开源扩散大模型D2F吞吐量超LLaMA3。技术路线呈现“轻量化+开源”趋势,降低开发者门槛,加速生态繁荣。
2025-08-17
大模型轻量化与量化突破
北大提出首个复数域2比特大模型iFairy,把权重压缩到1/8且推理仅需加减法,手机可跑;Meta开源70亿参数DINOv3,自监督视觉模型刷新SOTA。两者共同标志“大模型小型化”进入实用拐点,为端侧部署、低成本落地打开空间。
2025-06-23
教育专用大模型轻量化
网易有道开源14B参数“子曰3”,以低成本实现数学推理超越更大模型,为教育普惠提供轻量高性能方案,带动AI教辅、公平化学习新趋势。
2025-04-21
轻量化与端侧AI突围
微软BitNet b1.58 2B4T、Intel AI Playground、Gemma 3 QAT等原生低比特模型开源,0.4GB内存+单CPU即可跑2B参数,性能媲美全精度;Arc核显、3090消费级显卡成为边缘AI新算力,推动PC、智能音箱、IoT设备本地跑大模型,降低云成本与隐私风险,加速AI普惠。
2025-04-18
端侧 AI 与硬件加速
微软 1-bit BitNet 仅 0.4GB 内存跑 2B 模型,联发科天玑 9400+ 提出 AGENTIC AI UX,RTX 5060 Ti 凭 DLSS 4 本地跑 32B 大模型,显示“手机+PC”端侧轻量化部署进入实用阶段。
2025-04-13
端侧高效大模型技术突破
面壁&清华提出神经元级稀疏激活,手机可跑GPT级模型;上海AI Lab与西工大用4090实现大场景几何重建,显示端侧算力瓶颈正被算法创新打破。轻量化与稀疏化成为大模型落地新范式,为IoT、移动AR等应用打开空间。
2025-03-06
开源轻量推理模型大战
阿里通义千问开源QwQ-32B,以1/10成本实现对标DeepSeek-R1的推理性能,消费级显卡可跑;360、Light-R1等跟进,掀起“小参数+强化学习”复现o1/R1热潮,显著降低大模型落地门槛,加速端侧与中小企业部署。
2025-02-26
终端AI全面落地
AI能力正快速下沉到家电、汽车、耳机、办公等终端:美的空调首发DeepSeek语音、岚图<1秒AI车机、小米耳机同声传译、荣耀YOYO 2.0、零跑B10双模型智驾,端侧算力与模型轻量化同步突破,开启“万物原生AI”时代。
2025-02-16
全球AI算力军备赛
Epoch AI报告显示AI硬件超140款,谷歌坐拥百万H100等效算力,行业算力需求指数级攀升;同时清华专家在巴黎峰会呼吁大模型轻量化、低能耗,凸显“性能狂飙”与“绿色算力”两条路线并行,将深刻影响芯片、云服务和能源政策。
2024-12-01
本地部署与轻量模型新趋势
CPU可跑大模型、iPad AI绘画神器走红、无需Transformer的滤波器预测登顶NeurIPS,社区对“轻量化、端侧化、非Transformer架构”的探索升温。在算力垄断与云成本压力下,去中心化、低门槛的AI方案成为开发者新宠。
2024-11-30
端侧与多模态模型开源潮
智谱AI开源GLM-Edge端侧大语言及多模态系列,腾讯文档3.9.0升级AI助手,标志国产模型向轻量化、场景化落地提速,降低开发者门槛,加速边缘AI生态繁荣。
2024-11-27
终端与边缘AI落地
HuggingFace推2B SmolVLM、英特尔在印建AI PC中心、阿里通义适配鸿蒙多端,显示大模型正向边缘侧轻量化迁移,降低对云端算力依赖,为IoT、PC、手机带来新交互与商业空间。
2024-06-29
端侧AI场景落地加速
奥迪宣布集成ChatGPT至200万辆汽车,联想懂的通信探讨AI改变车联体验;华东师大课堂用大模型助教自动生成大纲。车载、教育、通信等场景密集落地,表明模型轻量化与工程化成熟,AI正从“能用”走向“好用”,带动边缘算力与数据服务需求。
2024-02-15
华为盘古大模型轻量化
华为推出1.5B参数的盘古轻量版,在端侧实现高性能推理,降低部署成本,展现国产大模型“小而强”路线,为边缘场景、行业客户及移动设备提供可落地的私有化AI方案,加速国内大模型生态普及。
2024-01-17
GPT-4级应用下沉终端
微软Copilot Pro把GPT-4塞进Office全家桶,腾讯PhotoMaker一键生成明星写真,AI PC在CES集中亮相,显示大模型正从云端走向个人电脑与移动设备,付费订阅与轻量化部署成为商业化主路径。