算力优化 - AI话题

2026-07-17

算力优化与能源协同

算力效率与绿色能源成为AI可持续发展关键。小红书联合高校提出HYPIC缓存，首token延迟降低3.25倍；智谱收购中科加禾补强国产算力适配；商汤、达卯发布算电协同方案，电力成本Token产出提升80%。行业共识形成：算力的尽头是更高效计算范式与能源融合。

算力优化算电协同国产算力推理优化绿色AI

2026-06-28

模型训练与推理效率优化

英伟达开源NeMo AutoModel实现MoE模型微调3.7倍加速；清华UDS通过智能样本筛选降低SFT算力；北大与智源提出机理数据归因；华为关键帧选择破解长视频算力瓶颈。从训练数据优化到推理框架加速，全链条效率提升成为行业焦点，推动大模型在学术与工业场景更易部署。

训练效率 MoE 数据筛选算力优化 ICML

2026-05-22

大模型技术突破与基础设施

该主题聚焦大模型核心技术突破与AI基础设施建设，涵盖智谱GLM-5.1高速版刷新全球API速度纪录、字节跳动开源统一多模态模型Lance 3B、阿里Qwen3.7-Max登顶评测榜，以及智谱ZCube重构推理网络、万卡集群算力优化等基础设施创新。这些进展标志着国产大模型在性能、速度和工程化能力上实现全面跃升，为AI规模化应用奠定坚实技术基础。

大模型 GLM-5.1 Lance 3B AI基础设施算力优化

2025-11-22

中国 AI 应用与算力突围

“灵光”App 4 天破百万下载刷新全球增速；华为开源 Flex:ai 框架统一 GPU/NPU 提升 30% 算力效率；MEET2026 大会集结百度、京东、高通共议 AI Infra 与出海，中国正从模型追赶到应用-算力双轨领跑。

AI应用算力优化 Flex:ai 灵光 MEET2026

2025-06-10

端侧与高效小模型崛起

“小模型+高效推理”成为新赛道：清华&面壁0.5B模型端侧SOTA，4090可跑；Adobe单卡4090实现实时视频生成；港科大-快手进化搜索让小模型作画媲美大模型；Prot42仅依赖序列即可8k长程建模蛋白质。低算力需求+本地部署，将加速AI在移动、IoT、生物设计等场景渗透。

端侧模型小模型实时生成蛋白质设计算力优化

2025-06-09

端侧与高效推理创新

面壁“小钢炮”架构、SLOT 样本级优化、华为昇腾万卡集群等方案，将长文本与大规模模型推理成本降低数十倍，推动端侧部署和实时应用普及。

端侧推理算力优化万卡集群 SLOT

2025-06-06

AI硬件与底层优化

AMD收购Brium挑战英伟达、华为CloudMatrix 384超节点训推共卡提速50%、清华蚂蚁开源全异步RL框架AReaL，显示AI芯片与系统级优化成为大厂争夺下一波算力红利的主战场，国产方案开始崭露头角。

AMD 华为异步RL AI硬件算力优化

2025-04-13

端侧高效大模型技术突破

面壁&清华提出神经元级稀疏激活，手机可跑GPT级模型；上海AI Lab与西工大用4090实现大场景几何重建，显示端侧算力瓶颈正被算法创新打破。轻量化与稀疏化成为大模型落地新范式，为IoT、移动AR等应用打开空间。

端侧大模型稀疏激活 4090重建轻量化算力优化

2024-05-16

AI for Science基础设施跃进

Recursion建成制药业最大AI超算BioHive-2，微软&清华提出YOCO新架构把Llama3-70B塞进20GB显存，UIUC开源StarCoder2-Instruct无需OpenAI数据即登顶代码生成榜，AI科研算力与算法效率同步跃升。

AI超算 YOCO StarCoder 算力优化 AI4S

2024-04-20

AI基础设施与算力优化

亚马逊云科技指出八成CEO认为生成式AI将在18个月内颠覆所有行业，云厂商正通过高性能低成本算力、LLMOps可视化工作流、字节级模型MambaByte等创新，为企业大模型应用提供坚实基础设施与降本方案。

AI基础设施云计算 LLMOps MambaByte 算力优化

2024-03-26

硬件与系统优化

3140亿参数Grok-1在PyTorch+HuggingFace生态下推理加速3.8倍，地平线招股书披露重研发高增长现金流健康，显示大模型竞赛进入“算力+系统”协同优化新阶段，国产芯片与框架受益。

推理加速国产芯片地平线算力优化大模型系统

2024-02-20

大模型推理优化与硬件竞速

LLM进入“毫秒级”交互时代，推理成本成为落地瓶颈。UC伯克利开源百万token上下文视频模型LWM，RWKV推出1%成本比肩7B的Eagle RNN，谷歌TPU系创业团队发布10倍于GPU的专用芯片，国内框架分享“榨干算力”实践，显示算法-芯片-系统协同优化正成为新战场。

LLM推理上下文窗口专用芯片 RWKV 算力优化

2024-01-12

国产多模态与MoE大模型突破

字节跳动4K/8K视频生成模型MagicVideo-V2效果超Gen-2，荣耀MagicOS 8.0将大模型深度融入手机系统，首个国产开源MoE模型性能媲美Llama 2但算力降60%，显示中国在多模态与高效架构上的快速追赶。

视频生成 MoE大模型国产开源多模态算力优化

2024-01-06

模型效率与低成本训练

潞晨科技提出千元级专业大模型方案，SOLAR嫁接模型+开源数据集降低门槛；FRCNN联邦框架在边缘数据上既保隐私又提性能，算力紧缺背景下“省钱增效”成为行业刚需。

低成本训练 SOLAR 联邦学习算力优化

AI快开门

发现AI的无限可能

# 算力优化