长思维链 - AI话题

2025-05-30

大模型推理与效率突破

华为、DeepSeek、斯坦福等接连发布推理加速、长思维链涌现、低延迟内核等新技术，显著降低算力消耗并提升准确率，标志着后训练优化成为大模型落地关键路径，为端侧部署与实时交互打开空间。

2025-03-05

推理大模型军备竞赛

DeepSeek-R1、OpenAI o3/o1、Anthropic Claude-3.7-Sonnet、xAI Grok-3等顶尖推理模型密集发布，竞技场排名瞬息变化；开源社区同步推出INT8量化、CoE内存优化、VFMGL多模态迁移等配套技术，标志着“长思维链+强化学习”成为头部厂商必争高地，直接决定下一代AI基础设施格局。

推理模型 DeepSeek-R1 Claude-3.7 Grok-3 长思维链

2025-02-10

推理模型技术突破

清华&CMU证明无需SFT仅靠RL即可涌现长思维链；DeepSeek-R1用GRPO把显存暴降80%，7GB本地可跑671B满血版；OpenAI已内测GPT-4.5，编程能力年底冲击人类TOP1，推理范式进入低成本、高可解释新阶段。

推理模型 RL GRPO GPT-4.5 长思维链

AI快开门

发现AI的无限可能

# 长思维链

大模型推理与效率突破

推理大模型军备竞赛

推理模型技术突破