2025-11-22
中国 AI 应用与算力突围
“灵光”App 4 天破百万下载刷新全球增速;华为开源 Flex:ai 框架统一 GPU/NPU 提升 30% 算力效率;MEET2026 大会集结百度、京东、高通共议 AI Infra 与出海,中国正从模型追赶到应用-算力双轨领跑。
2025-06-10
端侧与高效小模型崛起
“小模型+高效推理”成为新赛道:清华&面壁0.5B模型端侧SOTA,4090可跑;Adobe单卡4090实现实时视频生成;港科大-快手进化搜索让小模型作画媲美大模型;Prot42仅依赖序列即可8k长程建模蛋白质。低算力需求+本地部署,将加速AI在移动、IoT、生物设计等场景渗透。
2025-06-09
端侧与高效推理创新
面壁“小钢炮”架构、SLOT 样本级优化、华为昇腾万卡集群等方案,将长文本与大规模模型推理成本降低数十倍,推动端侧部署和实时应用普及。
2025-06-06
AI硬件与底层优化
AMD收购Brium挑战英伟达、华为CloudMatrix 384超节点训推共卡提速50%、清华蚂蚁开源全异步RL框架AReaL,显示AI芯片与系统级优化成为大厂争夺下一波算力红利的主战场,国产方案开始崭露头角。
2025-04-13
端侧高效大模型技术突破
面壁&清华提出神经元级稀疏激活,手机可跑GPT级模型;上海AI Lab与西工大用4090实现大场景几何重建,显示端侧算力瓶颈正被算法创新打破。轻量化与稀疏化成为大模型落地新范式,为IoT、移动AR等应用打开空间。
2024-05-16
AI for Science基础设施跃进
Recursion建成制药业最大AI超算BioHive-2,微软&清华提出YOCO新架构把Llama3-70B塞进20GB显存,UIUC开源StarCoder2-Instruct无需OpenAI数据即登顶代码生成榜,AI科研算力与算法效率同步跃升。
2024-04-20
AI基础设施与算力优化
亚马逊云科技指出八成CEO认为生成式AI将在18个月内颠覆所有行业,云厂商正通过高性能低成本算力、LLMOps可视化工作流、字节级模型MambaByte等创新,为企业大模型应用提供坚实基础设施与降本方案。
2024-03-26
硬件与系统优化
3140亿参数Grok-1在PyTorch+HuggingFace生态下推理加速3.8倍,地平线招股书披露重研发高增长现金流健康,显示大模型竞赛进入“算力+系统”协同优化新阶段,国产芯片与框架受益。
2024-02-20
大模型推理优化与硬件竞速
LLM进入“毫秒级”交互时代,推理成本成为落地瓶颈。UC伯克利开源百万token上下文视频模型LWM,RWKV推出1%成本比肩7B的Eagle RNN,谷歌TPU系创业团队发布10倍于GPU的专用芯片,国内框架分享“榨干算力”实践,显示算法-芯片-系统协同优化正成为新战场。
2024-01-12
国产多模态与MoE大模型突破
字节跳动4K/8K视频生成模型MagicVideo-V2效果超Gen-2,荣耀MagicOS 8.0将大模型深度融入手机系统,首个国产开源MoE模型性能媲美Llama 2但算力降60%,显示中国在多模态与高效架构上的快速追赶。