2026-05-30

AI数学推理与奥林匹克突破

Gemini在IMO国际数学奥林匹克竞赛中斩获金牌,标志着AI在复杂数学推理领域实现重大突破。这一成就显示出大语言模型在形式化数学证明和逻辑推理方面的巨大潜力,关键算法人才的贡献凸显了顶尖AI研究的重要性,为科学发现自动化和高级认知智能发展奠定重要基础。
2026-05-27

基础模型突破与科学发现

OpenAI、Anthropic推理模型自主攻克埃尔德什单位距离猜想等数学难题;MiniMax、小米等发布新一代大模型,在参数效率和多模态能力上实现突破。标志着AI正从"研究助理"向"科学发现者"演进,推动科学研究范式变革。
2026-05-26

AI科研与数学突破

AI在基础科学研究中展现强大潜力,谷歌DeepMind AlphaProof Nexus攻克悬置56年的埃尔德什数学难题;国产AI实现全球首例"AI造AI"自动化训练;强化学习应用于空间组学实验设计,推动AI for Science进入新阶段。
2026-05-25

AI科研与科学发现自动化

FutureHouse推出全球首个全自动AI科学家Robin,两小时内完成传统需四个月的研究;DeepMind智能体一次性解决9个Erdős数学问题;人大高瓴团队提出晶体结构预测孪生基座模型;Nature发表AI科研编程系统ERA。AI正从科研辅助工具升级为自主发现主体,显著加速科学突破进程。
2026-05-21

AI科研与数学突破

AI在基础科研领域实现重大突破,OpenAI推理模型首次自主证明Erdős单位距离猜想,解决80年数学难题。Gemini for Science、Co-Scientist等工具推动科研范式变革,AI在能源普查、生物医药、材料科学等领域展现原创性发现能力。
2026-05-19

AI for Science与学术前沿

AI深度重塑科学研究,陶哲轩宣布改变数学工作流应对AI证明过载,上海AI实验室开源35B参数科学大模型Intern-S2。腾讯发布首个古文字OCR基准,多模态数学推理和蛋白质设计取得突破,显示AI在科学发现中的专业化应用加速。
2026-05-12

AI数学能力逼近奇点

谷歌AI Co-Mathematician助牛津教授攻克群论数十年难题,ChatGPT 5.5 Pro被菲尔兹奖得主证实17分钟产出论文级成果。AI数学推理从辅助直觉走向“准自主证明”,高阶科研岗位与人才培养模式面临重塑。
2026-05-11

AI for Math 突破临界点

谷歌DeepMind AI数学家48%正确率破解60年未解难题,浙大校友AI框架刷新32年拉姆齐数下界,GPT-5.5 Pro两小时输出博士级证明,显示AI在抽象推理、形式化证明环节已越过“辅助”阶段,成为基础科研的共创者。
2026-05-10

AI for Math与科学发现范式突破

谷歌AI联合牛津数学家破解群论悬案、AlphaEvolve一周年助攻陶哲轩、浙大校友AI刷新32年拉姆齐数下界,显示大模型在形式化证明与组合数学中已超越人类专家,开启“AI猜想-人机共证”的新科研范式。
2026-05-09

AI数学推理登顶

未公开的ChatGPT 5.5 Pro与谷歌“AI联合数学家”在一小时内分别攻克博士级组合难题与群论悬案,首次被菲尔兹奖得主公开背书,标志着大模型从“背公式”跃进到“原创证明”,冲击数学研究范式。
2026-03-16

AI for Science再突破

谷歌AlphaEvolve自主写算法刷新5项数学纪录,OpenFold3-preview2开源逼近AlphaFold3精度,卡内基梅隆AQuaRef用量子力学精修蛋白结构,AI正从辅助工具跃升为科学发现的核心引擎。
2026-03-15

AI×Science范式升级

陶哲轩创办SAIR Foundation,亲自出任联合创始人,推动AI赋能数学发现与推理;同期“Vibe Modeling”读书会招募发起人,倡导用自然语言描述思想即可自动建模,科研从“写代码”升级为“写思想”,AI×Science进入“零门槛”新范式。
2026-03-13

AI安全与治理紧迫性上升

Anthropic成立官方智库预警AGI冲击,360发布首份OpenClaw安全部署指南,工信部加强监管;苏炜杰获统计学最高奖呼吁为AI建立新数学语言,显示技术突破与风险治理同步进入深水区。
2026-03-09

Claude数学与漏洞挖掘封神

Anthropic Claude Opus 4.6一周内两次刷新行业认知:先是用1小时帮88岁图灵奖得主高德纳破解困扰其30年的组合数学悬案,令学界惊呼“Shock”;紧接着与Mozilla合作,两周内自动挖出Firefox 100+安全漏洞(含14个高危),占Mozilla全年高危修复量1/5,首次证明大模型在形式化推理与漏洞狩猎上已超越人类专家极限,为AI for Math & Security树立新里程碑。
2026-03-08

AI极限推理瓶颈

“人类最后考试”与HardcoreLogic新基准双双揭示:顶级大模型在深度数学证明、多步符号推理任务上仍远不及人类专家,最高得分仅50%,凸显原创性与严谨逻辑仍是AI核心短板,为后续算法突破指明方向。
2026-01-25

顶级人才新路径

17岁高中生用AI攻克数学猜想获陶哲轩点赞,o1核心成员自述无博士论文仍进OpenAI,揭示顶尖AI机构评估人才的“产出>学历”新标尺,将倒逼全球高校与培养体系改革。
2026-01-19

AI科研与数学突破

GPT-5.2 Pro独立完成45年未解的埃尔德什数论猜想,清华&芝大Nature论文揭示AI使科学家提前1.37年晋升,显示大模型在数学、科研方法论与学术生态中的颠覆性作用,AI正从辅助工具升级为“独立发现者”。
2026-01-17

AI数学定理证明突破

Gemini内部数学模型首次在无联网条件下协助证明代数几何新定理,获陶哲轩等顶尖数学家高度评价,被视为AI迈向超级智能的关键里程碑,预示人机协同攻克数学奇点时代来临。
2026-01-12

国产大模型编程突围

DeepSeek-V4 春节前后发布,主打长代码生成与理解,内部评测已超 Claude、GPT;叠加清华系数学证明模型 AxiomProver 在普特南竞赛 12 题满分,标志国产大模型在垂直专业领域首次实现全球领先,有望重塑开发者生态与科研范式。
2025-12-26

国产大模型开源与性能突破

通义千问、混元、Seed等国产大模型密集开源或升级:Qwen-Image-Edit解决图像漂移,混元T1-Vis上线,Seed Prover 1.5 IMO夺金,2.6B小参数LFM2在边缘端比肩百亿模型,显示国产模型正快速缩小与国际差距并探索差异化优势。