2026-01-17

AI数学定理证明突破

Gemini内部数学模型首次在无联网条件下协助证明代数几何新定理,获陶哲轩等顶尖数学家高度评价,被视为AI迈向超级智能的关键里程碑,预示人机协同攻克数学奇点时代来临。
2025-08-21

GPT-5数学与科研突破

OpenAI GPT-5 Pro被曝独立证明新数学定理,读论文后给出更精确边界,总裁称出现“生命迹象”;同时GPT-5在SWE-bench Verified以74.9%得分宣称代码能力全球第一,虽被质疑“跳过难题”,仍预示模型向科研与推理密集型场景渗透,可能重塑学术与工业研发流程。
2025-07-19

顶尖模型数学推理突破

Gemini 2.5 Pro在IMO 2025大模型数学竞赛中以30%+总成绩遥遥领先,8B参数的Goedel-Prover-V2更击败671B模型重夺定理证明王座,显示小参数也能在形式化推理上实现越级打怪,数学成为检验大模型极限能力的“试金石”。
2025-06-07

数学与科学AI新工具

腾讯AI Lab与上海交大推出12.1万高难度数学题数据集,训练7B模型定理证明性能媲美Claude3.7;ICML 2025入选的CGFlow实现分子与合成路径协同设计,为AI驱动数学研究与新药发现提供强力工具。
2024-10-17

AI for Science与数学突破

陶哲轩领衔用AI在19天完成4694条定理蕴含图99.99%证明;扩散模型被重新定义为演化算法;GNNOpt、几何图学习等方法加速材料与酶工程研发,显示AI正在重塑基础科研范式,提升发现效率一个量级。
2024-10-13

AI数学推理突破

清华校友团队用LeanAgent系统成功证明162个高阶数学定理,攻克陶哲轩形式化难题;同时o1模型在复杂推理任务上再进化,显示大模型数学与逻辑能力正快速逼近甚至超越人类专家,为科研自动化打开新范式。
2024-08-18

数学大模型开源潮

DeepSeek开源专攻数学定理证明的大模型,刷新高中及大学级别基准SOTA,降低形式化数学门槛;同期亚马逊开源RAGChecker诊断工具,系统评估检索增强生成在数学问答中的事实忠实度,标志数学AI正从“做题”走向“证题”与“诊断”并行的新阶段。
2024-08-10

学术前沿与人才动态

CMU-清华LeanSTaR框架让LLM边思考边证明定理刷新miniF2F榜单,UCLA华人研究生联手MIT破解组合数学等差数列难题,吴恩达亲授Python AI新课降低入门门槛,顶级高校与在线教育平台持续为AI研究与应用输送新方法与人才。
2024-07-21

数学AI与竞赛生态

中国队IMO五连冠被美终结,陶哲轩为AI数学挑战团队颁奖并倡议打造“数学ImageNet”,预示AI在定理证明、自动解题等方向将复制ImageNet式突破,数学或成AI下一个竞技与数据高地。
2024-06-16

AI for Math与形式化证明

陶哲轩等顶尖数学家公开宣称AI将颠覆数学研究,Lean等形式化工具可一次性秒杀成百上千条定理,预示数学证明进入“半自动化”时代,为AI科学发现树立新范式。
2024-05-03

AI科学计算突破

谷歌SEEDS生成式天气预报登Science子刊,用AI集合预测替代昂贵物理模拟;数学家受陶哲轩启发用AI形式化费马大定理证明,展现生成式方法在气象与形式证明中的跨学科潜力。
2024-04-23

AI for Math与数学推理数据

陶哲轩发布AI数学资源清单,汇总OpenWebMath、Proof-Pile-2等高质量数据集,为训练专用数学大模型提供燃料,有望加速自动定理证明、科学计算与下一代科学大模型突破。
2024-02-04

AI自动化定理证明

谷歌、UMass、UIUC联合利用LLM自动生成完整数学证明,获软件工程顶会杰出论文;上下文越全,证明成功率越高,为大模型在形式化验证与数学研究打开新场景。