2026-03-16

AI for Science再突破

谷歌AlphaEvolve自主写算法刷新5项数学纪录,OpenFold3-preview2开源逼近AlphaFold3精度,卡内基梅隆AQuaRef用量子力学精修蛋白结构,AI正从辅助工具跃升为科学发现的核心引擎。
2026-03-15

AI×Science范式升级

陶哲轩创办SAIR Foundation,亲自出任联合创始人,推动AI赋能数学发现与推理;同期“Vibe Modeling”读书会招募发起人,倡导用自然语言描述思想即可自动建模,科研从“写代码”升级为“写思想”,AI×Science进入“零门槛”新范式。
2026-03-13

AI安全与治理紧迫性上升

Anthropic成立官方智库预警AGI冲击,360发布首份OpenClaw安全部署指南,工信部加强监管;苏炜杰获统计学最高奖呼吁为AI建立新数学语言,显示技术突破与风险治理同步进入深水区。
2026-03-09

Claude数学与漏洞挖掘封神

Anthropic Claude Opus 4.6一周内两次刷新行业认知:先是用1小时帮88岁图灵奖得主高德纳破解困扰其30年的组合数学悬案,令学界惊呼“Shock”;紧接着与Mozilla合作,两周内自动挖出Firefox 100+安全漏洞(含14个高危),占Mozilla全年高危修复量1/5,首次证明大模型在形式化推理与漏洞狩猎上已超越人类专家极限,为AI for Math & Security树立新里程碑。
2026-03-08

AI极限推理瓶颈

“人类最后考试”与HardcoreLogic新基准双双揭示:顶级大模型在深度数学证明、多步符号推理任务上仍远不及人类专家,最高得分仅50%,凸显原创性与严谨逻辑仍是AI核心短板,为后续算法突破指明方向。
2026-01-25

顶级人才新路径

17岁高中生用AI攻克数学猜想获陶哲轩点赞,o1核心成员自述无博士论文仍进OpenAI,揭示顶尖AI机构评估人才的“产出>学历”新标尺,将倒逼全球高校与培养体系改革。
2026-01-19

AI科研与数学突破

GPT-5.2 Pro独立完成45年未解的埃尔德什数论猜想,清华&芝大Nature论文揭示AI使科学家提前1.37年晋升,显示大模型在数学、科研方法论与学术生态中的颠覆性作用,AI正从辅助工具升级为“独立发现者”。
2026-01-17

AI数学定理证明突破

Gemini内部数学模型首次在无联网条件下协助证明代数几何新定理,获陶哲轩等顶尖数学家高度评价,被视为AI迈向超级智能的关键里程碑,预示人机协同攻克数学奇点时代来临。
2026-01-12

国产大模型编程突围

DeepSeek-V4 春节前后发布,主打长代码生成与理解,内部评测已超 Claude、GPT;叠加清华系数学证明模型 AxiomProver 在普特南竞赛 12 题满分,标志国产大模型在垂直专业领域首次实现全球领先,有望重塑开发者生态与科研范式。
2025-12-26

国产大模型开源与性能突破

通义千问、混元、Seed等国产大模型密集开源或升级:Qwen-Image-Edit解决图像漂移,混元T1-Vis上线,Seed Prover 1.5 IMO夺金,2.6B小参数LFM2在边缘端比肩百亿模型,显示国产模型正快速缩小与国际差距并探索差异化优势。
2025-12-15

AI for Science新进展

陶哲轩团队48小时AI破解50年数学难题、微软5美元病理切片生成免疫图谱登上《Cell》、浙大LamNet加速药物自由能计算,表明大模型与领域知识结合正在重塑科研方法论,显著缩短假设-验证周期。
2025-12-02

AI基础研究与数学突破

AI 6小时破解30年Erdős难题、AlphaFold五年解析2亿蛋白、清华持续学习超网络入选顶会,表明大模型在数学、生物、认知理论等基础科学领域开始产出原创成果,反哺算法创新。
2025-11-29

开源数学大模型突破

DeepSeek连发两篇论文并开源DeepSeekMath-V2,成为首个在IMO 2025夺金的开源模型,打破谷歌OpenAI闭源垄断,验证强化学习+自验证路径,提振开源社区冲击高阶推理。
2025-11-28

国产多模态与数学大模型爆发

DeepSeek-Math-V2 首次以开源身份夺 IMO 金牌,快手 Keye-VL-671B、阿里 Z-Image、智谱清影 2.0 等国产多模态密集发布,性能对标 GPT-4o,标志中国在数学推理与视频/图像生成进入第一梯队。
2025-11-25

AI4S与数学推理突破

GPT-5早期科研版帮助数学家破解Erdős难题、将生物实验推理压缩至分钟级;陶哲轩借助Gemini十分钟攻克连续整数结构难题;吴恩达推出ICLR级论文自动评审Agent。AI正从“聊天工具”升级为“硅基科研员”,显著加速跨学科研究进程,推动科研范式转变。
2025-11-10

中国模型性能登顶

阿里Qwen3-Max-Thinking全球数学竞赛夺魁,月之暗面Kimi K2仅用460万美元训练费刷新“人类终极考试”榜首,文心大模型5.0文本能力LMArena第一,国产大模型进入性价比与性能双领先阶段。
2025-10-29

AI+垂直科学探索

谷歌DeepMind发起“AI for Math”全球联盟,MIT斯坦福GeoEvolve让AI自我迭代做地理科研,北大联合提出PALQO加速量子算法,AI正从辅助工具升级为科学发现合伙人。
2025-10-19

AI数学科研范式革命

GPT-5周末内破解10道埃尔德什百年难题,印证陶哲轩“AI将接管文献与验证”预言,标志数学研究从人脑猜想步入人机共创新范式,基础科学发现速度或指数级提升。
2025-10-12

AI数学与科研范式突破

GPT-5 Pro在11分钟内完成陶哲轩三年未解的微分几何证明,华盛顿大学LLMc以LLM语义理解实现超越ZIP的无损压缩,斯坦福ACE框架用上下文自我进化替代微调,显示大模型在数学、压缩、自适应等科研核心环节的范式级能力跃迁。
2025-10-11

AI科研与数学证明突破

陶哲轩借助GPT-5 Pro在11分钟内完成3年未解的微分几何证明,西湖大学DeepScientist、MIT生成式机器人训练工具等显示大模型正成为科学家标配,推动科研范式从“人脑驱动”迈向“人机共创”。