2025-12-14
算力瓶颈与芯片极限
太初元碁联合创始人指出AI算法已触单芯片算力天花板,毫秒级精度需求推动算力指数级增长。行业进入“高强度算力周期”,倒逼Chiplet、光互连与异构计算创新,芯片级能效比成为大模型规模化的生死线,影响云厂商与初创公司的资本支出节奏。
2025-10-16
终端AI芯片与硬件落地
苹果M5芯片打出“4倍AI性能+24小时续航”组合拳,英特尔至强6+转向2nm,谷歌开源Coral NPU让大模型跑手表,表明巨头正把生成式AI能力锁进终端硬件,边缘推理与能效比成为下一轮硬件竞争核心指标。
2025-09-15
硬件-光学算力革命
微软、浙大团队相继在Nature发表光学AI芯片成果,利用Micro LED与衍射光学实现百倍能效提升,可脱离GPU运行,为端侧与边缘大模型提供颠覆性算力路径,可能重塑AI硬件供应链。
2025-05-30
能耗与算力供应链
研究预警2025年底AI能耗将超比特币挖矿,英伟达Q1数据中心收入391亿美元再创纪录,EnCharge AI发布能效×20芯片,凸显算力需求暴涨与绿色硬件的博弈,将重塑芯片与能源投资逻辑。
2025-03-29
AI计算范式革新
港大&英伟达提出“测试时计算”自动驾驶框架,让车辆在线持续学习,变道场景成功率提升 18%;酷睿 Ultra 200HX 游戏本 AI 能效比提升 40%,边缘算力再升级。从云训练到端侧实时演化,新范式降低数据回传成本,加速 AI 向实时物理世界渗透。
2024-09-17
高效微调与硬件革新
上交&哈佛提出LoRA-Dash,把特定任务微调参数量再降8-16倍;Nature研究发布新型忆阻器,能效达Haswell CPU的460倍,为昂贵LLM的端侧部署与节能训练提供新路径。
2024-06-10
模型压缩与能效革新
港大、北航等提出BiLLM方法,将大模型参数压缩至1.1 bit,在IEEE获评为“解决AI能源需求”的关键进展; Northwestern博士论文系统阐述多级智能体建模,为城市、医疗等复杂系统提供低耗高效决策支持。极致压缩与高效建模双轨并进,助力大模型可持续落地。
2024-03-09
大模型性能突破与能效优化
Inflection-2.5以40%算力逼近GPT-4性能,Claude 3 Opus竞技场紧追不舍,清华1bit量化让模型瘦身90%仍保83%能力,标志着大模型进入“高效能-低能耗”新阶段,将重塑云端与边缘部署格局。