2026-02-22
硬件创新挑战英伟达霸主
24人初创团队发布17000 token/s推理芯片,性能10倍于Cerebras、成本降20倍,AMD前高管与硅谷天使联手,预示AI芯片进入“小快灵”颠覆时刻,算力垄断格局或松动。
2026-02-21
AI芯片性能竞赛
24人创业团队推出每秒17000 token的推理芯片,直接对标英伟达,标志着后摩尔时代AI算力格局可能出现新变量,对云厂商、大模型部署成本及边缘AI生态均有深远影响。
2026-02-14
国产大模型密集升级
春节前后,豆包2.0、MiniMax M2.5、DeepSeek V4测试版等国产大模型集中发布,推理成本大幅下降,支持超长上下文、多模态与复杂任务,标志国产基座模型进入性能+成本双优阶段,加速AI原生应用落地。
2026-02-11
算力与芯片突围
字节SeedChip计划十万颗量产、讯飞全国产算力星火X2、美国能源部D-CHAG降内存75%等进展,凸显中美在AI算力“卡脖子”与自主创新双线竞速;云厂商与超算中心通过架构级优化缓解GPU+电力瓶颈,决定大模型迭代节奏。
2026-01-27
国产大模型密集升级
阿里、百度、月之暗面等接连发布旗舰推理或多模态模型,参数与性能对标GPT-5.2,开源+免费策略加速生态渗透,标志着国产大模型进入“性能+工具”双轮驱动新阶段,对全球竞争格局产生实质冲击。
2026-01-23
AI推理效率革命:vLLM团队创业
全球主流开源推理引擎vLLM核心成员成立Inferact,获a16z与光速1.5亿美元种子轮、估值80亿美元,剑指AI推理成本压缩。同期北大团队发布模拟计算芯片,能效比提升228倍,显示“后训练”推理优化与硬件创新正成为AI实用化的新战场。
2026-01-21
端侧小模型突破
Liquid AI 1.2B推理模型仅900MB内存即可在手机离线运行“思考”模式,非Transformer架构的液态神经网络与英伟达ToolOrchestra小模型调度框架共同验证:小参数+高效工具调用可在端侧实现接近大模型的推理与Agent能力,端侧AI临界点已至。
2026-01-13
扩散模型并行推理革新
腾讯微信AI团队提出WeDLM,首次用因果注意力重构扩散语言模型,兼容KV缓存,实现并行生成与高效推理兼得,突破GPT类自回归模型速度瓶颈,为大模型端侧部署提供新范式。
2026-01-12
国产大模型编程突围
DeepSeek-V4 春节前后发布,主打长代码生成与理解,内部评测已超 Claude、GPT;叠加清华系数学证明模型 AxiomProver 在普特南竞赛 12 题满分,标志国产大模型在垂直专业领域首次实现全球领先,有望重塑开发者生态与科研范式。
2026-01-07
端侧AI与硬件融合
CES 2026集中展示端侧AI芯片、AI PC、AI眼镜、机器人等硬件创新,AMD、英伟达、联想、惠普、雷蛇等巨头发布新一代算力平台与终端,推动AI从云端向本地设备迁移,降低推理成本,开启“AI+硬件”融合新周期。
2026-01-06
大模型开源与推理新范式
DeepSeek-R1、Falcon H1R 7B、华为openPangu-VL-7B等轻量级开源模型轮番登顶榜单,以7B-30B参数实现千亿级性能,打破“唯规模论”;字节DLCM、清华LingoEDU提出概念级推理与结构化预处理,准确率最高提升51%,推动低成本、高可靠的行业微调落地,开源生态进入“小而强”时代。
2025-12-27
Agent成本骤降
浪潮元脑HC1000把推理成本压至1元/百万token,Meta SSR实现零人类数据自我训练,JarvisEvo一句话调用200+修图工具,三箭齐发打通Agent规模化“最后一公里”,商业化临界点提前。
2025-12-26
AI基础设施与算力军备赛
OpenAI联手博通打造10 GW定制推理芯片,英伟达闪电整合Groq技术防御TPU,北京提出2028年建设10个国际顶级开源项目并落地100个大模型,显示AI竞争已从模型层下沉到算力与芯片自主可控的新战场。
2025-12-26
国产大模型开源与性能突破
通义千问、混元、Seed等国产大模型密集开源或升级:Qwen-Image-Edit解决图像漂移,混元T1-Vis上线,Seed Prover 1.5 IMO夺金,2.6B小参数LFM2在边缘端比肩百亿模型,显示国产模型正快速缩小与国际差距并探索差异化优势。
2025-12-25
AI视频生成提速200倍
清华与生数科技开源TurboDiffusion框架,通过稀疏注意力与SageAttention把扩散模型推理提速100-200倍,消费级显卡即可秒级生成高分辨率视频,成本与门槛骤降,有望引爆短视频、广告、游戏等UGC内容生态。
2025-12-08
小模型逆袭与推理优化
英伟达、腾讯、DeepMind等接连发布8B-406B参数的小/中模型,通过工具调度、推理优化在单任务成本、速度上碾压GPT-5,显示“小而精”路线正重塑大模型竞争规则,降低落地门槛。
2025-12-07
Scaling终结与架构革新
Ilya、LeCun等顶尖学者公开宣告“纯靠堆参数”的Scaling Law进入收益递减期,行业开始转向原生多模态、视频推理、酶设计等新架构。NEO、Sora2、RFdiffusion2等模型验证“小算力+聪明结构”可超越传统大模型,标志AI研发范式从“越大越好”迈入“越巧越好”的新阶段,对芯片需求、创业路径和投资逻辑产生连锁冲击。
2025-12-06
谷歌Gemini 3系列霸榜
Gemini 3 Deep Think与Gemini 3 Pro相继发布,在IMO金牌级推理与多模态视觉基准上刷新SOTA,拉开与GPT-5系列差距,谷歌重夺“推理之王”称号,将全球基础模型军备竞赛推向新高点。
2025-12-02
智能体与自动驾驶推理
MIT OpenAGI、英伟达Alpamayo-R1、蚂蚁Agentar、阶跃GUI Agent等推出“先思考后行动”的推理型智能体,把链式思考引入自动驾驶与终端操控,降低幻觉提升决策可信度,开启物理AI落地元年。