能效 - AI话题 - AI快开门

2026-01-23

全球主流开源推理引擎vLLM核心成员成立Inferact，获a16z与光速1.5亿美元种子轮、估值80亿美元，剑指AI推理成本压缩。同期北大团队发布模拟计算芯片，能效比提升228倍，显示“后训练”推理优化与硬件创新正成为AI实用化的新战场。

2025-12-14

太初元碁联合创始人指出AI算法已触单芯片算力天花板，毫秒级精度需求推动算力指数级增长。行业进入“高强度算力周期”，倒逼Chiplet、光互连与异构计算创新，芯片级能效比成为大模型规模化的生死线，影响云厂商与初创公司的资本支出节奏。

2025-10-16

苹果M5芯片打出“4倍AI性能+24小时续航”组合拳，英特尔至强6+转向2nm，谷歌开源Coral NPU让大模型跑手表，表明巨头正把生成式AI能力锁进终端硬件，边缘推理与能效比成为下一轮硬件竞争核心指标。

2025-09-15

微软、浙大团队相继在Nature发表光学AI芯片成果，利用Micro LED与衍射光学实现百倍能效提升，可脱离GPU运行，为端侧与边缘大模型提供颠覆性算力路径，可能重塑AI硬件供应链。

2025-05-30

研究预警2025年底AI能耗将超比特币挖矿，英伟达Q1数据中心收入391亿美元再创纪录，EnCharge AI发布能效×20芯片，凸显算力需求暴涨与绿色硬件的博弈，将重塑芯片与能源投资逻辑。

2025-03-29

港大&英伟达提出“测试时计算”自动驾驶框架，让车辆在线持续学习，变道场景成功率提升 18%；酷睿 Ultra 200HX 游戏本 AI 能效比提升 40%，边缘算力再升级。从云训练到端侧实时演化，新范式降低数据回传成本，加速 AI 向实时物理世界渗透。

测试时计算自动驾驶边缘算力能效

2024-09-17

上交&哈佛提出LoRA-Dash，把特定任务微调参数量再降8-16倍；Nature研究发布新型忆阻器，能效达Haswell CPU的460倍，为昂贵LLM的端侧部署与节能训练提供新路径。

2024-06-10

港大、北航等提出BiLLM方法，将大模型参数压缩至1.1 bit，在IEEE获评为“解决AI能源需求”的关键进展； Northwestern博士论文系统阐述多级智能体建模，为城市、医疗等复杂系统提供低耗高效决策支持。极致压缩与高效建模双轨并进，助力大模型可持续落地。

2024-03-09

Inflection-2.5以40%算力逼近GPT-4性能，Claude 3 Opus竞技场紧追不舍，清华1bit量化让模型瘦身90%仍保83%能力，标志着大模型进入“高效能-低能耗”新阶段，将重塑云端与边缘部署格局。

# 能效