AI快开门

发现最好的AI工具

2025-11-22

中国 AI 应用与算力突围

“灵光”App 4 天破百万下载刷新全球增速;华为开源 Flex:ai 框架统一 GPU/NPU 提升 30% 算力效率;MEET2026 大会集结百度、京东、高通共议 AI Infra 与出海,中国正从模型追赶到应用-算力双轨领跑。
2025-06-10

端侧与高效小模型崛起

“小模型+高效推理”成为新赛道:清华&面壁0.5B模型端侧SOTA,4090可跑;Adobe单卡4090实现实时视频生成;港科大-快手进化搜索让小模型作画媲美大模型;Prot42仅依赖序列即可8k长程建模蛋白质。低算力需求+本地部署,将加速AI在移动、IoT、生物设计等场景渗透。
2025-06-09

端侧与高效推理创新

面壁“小钢炮”架构、SLOT 样本级优化、华为昇腾万卡集群等方案,将长文本与大规模模型推理成本降低数十倍,推动端侧部署和实时应用普及。
2025-06-06

AI硬件与底层优化

AMD收购Brium挑战英伟达、华为CloudMatrix 384超节点训推共卡提速50%、清华蚂蚁开源全异步RL框架AReaL,显示AI芯片与系统级优化成为大厂争夺下一波算力红利的主战场,国产方案开始崭露头角。
2025-04-13

端侧高效大模型技术突破

面壁&清华提出神经元级稀疏激活,手机可跑GPT级模型;上海AI Lab与西工大用4090实现大场景几何重建,显示端侧算力瓶颈正被算法创新打破。轻量化与稀疏化成为大模型落地新范式,为IoT、移动AR等应用打开空间。
2024-05-16

AI for Science基础设施跃进

Recursion建成制药业最大AI超算BioHive-2,微软&清华提出YOCO新架构把Llama3-70B塞进20GB显存,UIUC开源StarCoder2-Instruct无需OpenAI数据即登顶代码生成榜,AI科研算力与算法效率同步跃升。
2024-04-20

AI基础设施与算力优化

亚马逊云科技指出八成CEO认为生成式AI将在18个月内颠覆所有行业,云厂商正通过高性能低成本算力、LLMOps可视化工作流、字节级模型MambaByte等创新,为企业大模型应用提供坚实基础设施与降本方案。
2024-03-26

硬件与系统优化

3140亿参数Grok-1在PyTorch+HuggingFace生态下推理加速3.8倍,地平线招股书披露重研发高增长现金流健康,显示大模型竞赛进入“算力+系统”协同优化新阶段,国产芯片与框架受益。
2024-02-20

大模型推理优化与硬件竞速

LLM进入“毫秒级”交互时代,推理成本成为落地瓶颈。UC伯克利开源百万token上下文视频模型LWM,RWKV推出1%成本比肩7B的Eagle RNN,谷歌TPU系创业团队发布10倍于GPU的专用芯片,国内框架分享“榨干算力”实践,显示算法-芯片-系统协同优化正成为新战场。
2024-01-12

国产多模态与MoE大模型突破

字节跳动4K/8K视频生成模型MagicVideo-V2效果超Gen-2,荣耀MagicOS 8.0将大模型深度融入手机系统,首个国产开源MoE模型性能媲美Llama 2但算力降60%,显示中国在多模态与高效架构上的快速追赶。
2024-01-06

模型效率与低成本训练

潞晨科技提出千元级专业大模型方案,SOLAR嫁接模型+开源数据集降低门槛;FRCNN联邦框架在边缘数据上既保隐私又提性能,算力紧缺背景下“省钱增效”成为行业刚需。