数学大模型 - AI话题

2025-11-29

DeepSeek连发两篇论文并开源DeepSeekMath-V2，成为首个在IMO 2025夺金的开源模型，打破谷歌OpenAI闭源垄断，验证强化学习+自验证路径，提振开源社区冲击高阶推理。

2024-08-18

DeepSeek开源专攻数学定理证明的大模型，刷新高中及大学级别基准SOTA，降低形式化数学门槛；同期亚马逊开源RAGChecker诊断工具，系统评估检索增强生成在数学问答中的事实忠实度，标志数学AI正从“做题”走向“证题”与“诊断”并行的新阶段。

2024-08-09

阿里开源Qwen2-Math在多项数学基准上超越GPT-4o，腾讯混元多模态模型SuperCLUE-V夺冠，标志着国产大模型在细分能力上首次全面领先国际闭源旗舰，为本土生态注入高竞争力开源底座。

AI快开门