2026-02-22

硬件创新挑战英伟达霸主

24人初创团队发布17000 token/s推理芯片,性能10倍于Cerebras、成本降20倍,AMD前高管与硅谷天使联手,预示AI芯片进入“小快灵”颠覆时刻,算力垄断格局或松动。
2026-02-21

AI芯片性能竞赛

24人创业团队推出每秒17000 token的推理芯片,直接对标英伟达,标志着后摩尔时代AI算力格局可能出现新变量,对云厂商、大模型部署成本及边缘AI生态均有深远影响。
2026-01-19

AI科研与数学突破

GPT-5.2 Pro独立完成45年未解的埃尔德什数论猜想,清华&芝大Nature论文揭示AI使科学家提前1.37年晋升,显示大模型在数学、科研方法论与学术生态中的颠覆性作用,AI正从辅助工具升级为“独立发现者”。
2025-12-24

AI for Science与视频生成效率革命

深势科技8亿融资、TurboDiffusion 200倍加速、VTP视觉分词器开源等进展,显示AI在科学计算与视频生成两大高算力场景实现“低成本秒级”跃迁,科研与创意内容生产门槛被快速抹平,AI正从“可用”走向“好用、敢用”。
2025-11-23

算法优化与硬件加速

北大-华为-上财联合提出近线性时间聚类局部搜索算法,适用于大规模数据;IDEA研究院发布“万物可抓取”模型与国产GPU渲染器,打破国外垄断,共同提升AI计算效率与自主可控。
2025-11-09

AI科研范式革命

谷歌“联合科学家”AI两天破解人类十年难题,字节量子化学模拟登Nature子刊,蛋白轨迹扩散模型PTraj-Diff高效生成动力学,显示生成式AI正从辅助工具升级为科研合作者,显著缩短试错周期,推动医药、材料、化学等领域进入AI驱动发现新时代。
2025-11-01

Transformer架构再突破

月之暗面开源Kimi Linear注意力,首次在同等训练下超越全注意力,长文KV缓存降75%、推理加速6倍;上海AI Lab混合扩散语言模型SDAR突破6600 tgs。新机制冲击传统Transformer垄断,为长上下文、实时交互与端侧部署打开全新可能。
2025-11-01

世界模型与VLA引领机器人2.0

斯坦福×清华发布kuakua世界模型降低幻觉、提升动作跟随;Apple奖得主综述VLA(视觉-语言-动作)成ICLR 2026顶会热点;加速进化Booster K1开发板20分钟售罄。世界模型+VLA正成为具身智能统一框架,推动机器人从专用走向通用,加速产业落地。
2025-10-31

线性注意力架构革新

月之暗面Kimi Linear、智源Emu3.5等相继开源线性注意力或多模态世界模型,KV缓存降低75%、推理速度提升6倍,首次在性能上超越传统全注意力,标志着大模型架构从“平方代价”向“线性扩展”的关键拐点,为端侧部署与实时交互打开新空间。
2025-10-22

量子计算里程碑突破

谷歌“量子回声”算法登上Nature封面,首次实现可重复验证的量子优势,分子模拟速度比超算快13000倍,标志量子计算从实验室走向医药、材料等实际场景,开启实用化元年。
2025-10-22

长文本与推理效率突破

DeepSeek-OCR用视觉压缩颠覆分词器,北大华为LouisKV将长序列推理提速4.7倍,复旦Game-RL用游戏数据增强VLM推理,长上下文与推理成本难题出现新解法。
2025-10-13

扩散语言模型推理突破

蚂蚁集团开源dInfer框架,首次将扩散语言模型推理速度提升10倍,超越自回归范式,为大模型高效落地奠定新基座,被视为后Transformer时代的重要里程碑。
2025-09-30

AI科研突破量子计算

GPT-5在30分钟内攻克量子NP难题并给出关键证明思路,学术圈震动;OpenAI同期发布GDPval基准,强调模型在真实高价值经济任务中的可交付能力,显示大模型正从“对话工具”跃升为“诺奖级科研加速器”。
2025-09-29

AI 基础设施与算力成本革命

浪潮信息实现 8.9 ms 推理、1 元/百万 token 新纪录;华为 CloudMatrix384 超节点第一时间支持 DeepSeek V3.2;FlashAttention 作者预言 GPU 垄断三年内终结,硬件-软件协同优化正把 AI 推理推向“白菜价”时代。
2025-09-27

多模态与推理效率优化

华为诺亚ViSpec实现多模态大模型推理3.2倍加速;谷歌DeepMind让机器人具备“思考”能力,推理侧硬件需求骤降。算法级优化正打破“堆卡”迷信,为端侧部署与实时应用打开空间,推动大模型从云端走向边缘。
2025-09-14

科研与数学AI加速

DeepMind AI探测引力波登Science、AI高斯三周解决陶哲轩18个月难题,显示AI在基础科研与数学证明中已从辅助走向主导,加速科学发现周期。
2025-09-11

开源模型与推理加速突破

阿联酋K2 Think以320亿参数实现2000 tokens/秒刷新开源速度纪录;月之暗面开源Checkpoint Engine可在20秒内热更新万亿模型;清华提出ReST-RL统一强化学习范式,显著改善LLM推理一致性,开源生态正从“可用”迈向“高效”与“可信”。
2025-07-27

国产芯片+大模型性能突破

国产GPU在WAIC现场跑通“满血”DeepSeek,推理速度达100 tokens/s,两倍于海外旗舰卡,验证国产算力已可支撑千亿级模型部署;结合百元级端侧方案与“磐石”科学大模型,硬件-模型协同进入可用、好用阶段,降低AI算力成本与供应链风险。
2025-07-27

AI for Science与3D生成

上海AI Lab开源科学多模态大模型Intern-S1、“磐石”科学基础大模型及分子之心10大蛋白解决方案同步发布,实现波谱场多模态理解、AI蛋白可编程设计;结合腾讯开源混元3D,科研加速与3D内容生产双双进入“模型驱动”时代。
2025-07-12

扩散模型量化加速突破

港科大、北航、莫纳什联合提出TFMQ-DM框架,首次实现4-bit无损压缩+6倍推理加速,通过维护时间特征解决扩散模型量化敏感难题,为端侧高清生成铺平道路,入选TPAMI'25。