2025-05-30
大模型推理与效率突破
华为、DeepSeek、斯坦福等接连发布推理加速、长思维链涌现、低延迟内核等新技术,显著降低算力消耗并提升准确率,标志着后训练优化成为大模型落地关键路径,为端侧部署与实时交互打开空间。
2025-03-05
推理大模型军备竞赛
DeepSeek-R1、OpenAI o3/o1、Anthropic Claude-3.7-Sonnet、xAI Grok-3等顶尖推理模型密集发布,竞技场排名瞬息变化;开源社区同步推出INT8量化、CoE内存优化、VFMGL多模态迁移等配套技术,标志着“长思维链+强化学习”成为头部厂商必争高地,直接决定下一代AI基础设施格局。