2025-11-29
开源数学大模型突破
DeepSeek连发两篇论文并开源DeepSeekMath-V2,成为首个在IMO 2025夺金的开源模型,打破谷歌OpenAI闭源垄断,验证强化学习+自验证路径,提振开源社区冲击高阶推理。
2024-08-18
数学大模型开源潮
DeepSeek开源专攻数学定理证明的大模型,刷新高中及大学级别基准SOTA,降低形式化数学门槛;同期亚马逊开源RAGChecker诊断工具,系统评估检索增强生成在数学问答中的事实忠实度,标志数学AI正从“做题”走向“证题”与“诊断”并行的新阶段。
2024-08-09
国产多模态与数学模型突破
阿里开源Qwen2-Math在多项数学基准上超越GPT-4o,腾讯混元多模态模型SuperCLUE-V夺冠,标志着国产大模型在细分能力上首次全面领先国际闭源旗舰,为本土生态注入高竞争力开源底座。