2025-11-29
开源数学大模型突破
DeepSeek连发两篇论文并开源DeepSeekMath-V2,成为首个在IMO 2025夺金的开源模型,打破谷歌OpenAI闭源垄断,验证强化学习+自验证路径,提振开源社区冲击高阶推理。
2025-08-04
数学推理突破成焦点
谷歌Gemini 2.5 Deep Think获IMO金牌,字节Seed-Prover、清华校友提示词工程亦攻克IMO 2025,显示大模型在形式化数学推理赛道已逼近人类顶尖水平,为科研自动化与教育个性化打开新空间。
2025-08-03
顶级模型争霸
谷歌Gemini 2.5 Deep Think以IMO金牌成绩刷新多智能体推理上限,OpenAI GPT-5却因人才流失与技术瓶颈难产;巨头间模型性能与发布节奏直接决定云与API市场格局,引发连锁竞争。
2025-07-23
AI for Science深入分子与古文明
谷歌AI获IMO唯一金牌,DRUGAI用结构基础模型重编分子互作,Aeneas模型解析古罗马铭文,显示生成式AI正向数学、生物、人文等精密科研领域渗透。
2025-07-22
IMO数学奥赛AI夺金争议
OpenAI与谷歌DeepMind先后宣称其大模型在2025国际数学奥林匹克(IMO)达到金牌水平,引发主办方与学界批评“抢发”“炒作”。事件折射AI高阶推理突破,也暴露竞赛伦理与公关规则缺失,全球瞩目AI数学能力边界。
2025-07-21
顶级模型与推理突破
OpenAI、英伟达、谷歌等密集发布新一代大模型:GPT-5数学能力升级、神秘IMO金牌模型刷新奥数纪录,英伟达开源OpenReasoning-Nemotron登顶推理榜,标志通用推理与科学计算进入新阶段,将重塑科研、教育及高端开发工具链。
2025-07-20
AI for Math与竞赛成绩
中国队在2025 IMO包揽六金获团体冠军,其中满分学霸曾蹭北大韦神课程,显示顶尖数学人才储备与AI辅助训练结合下,人类数学竞赛水平持续攀升。
2025-07-19
顶尖模型数学推理突破
Gemini 2.5 Pro在IMO 2025大模型数学竞赛中以30%+总成绩遥遥领先,8B参数的Goedel-Prover-V2更击败671B模型重夺定理证明王座,显示小参数也能在形式化推理上实现越级打怪,数学成为检验大模型极限能力的“试金石”。
2025-04-30
开源大模型军备竞赛
阿里Qwen3系列、小米MiMo、DeepSeek-Prover-V2等密集开源,参数规模从70亿到235B不等,性能对标甚至超越闭源旗舰,标志中国开源模型进入“Llama替代”阶段,全球开发者生态迅速向Qwen+DeepSeek双极迁移,降低创业与科研门槛。
2025-04-30
AI编程颠覆开发者生产力
微软CEO官宣30%代码由AI生成,Claude Code实测79%前端任务可自动完成,小米MiMo 7B在奥数与代码生成上越级打平320B模型,低精度BitNet v2进一步降低本地部署门槛,预示“人类只改Bug”时代加速到来。
2025-04-26
小参数高效数学推理突破
英伟达1.5B模型在AIMO2奥赛击败14B级对手,验证“小模型+强数据”路线可行,开源OpenMath-Nemotron系列,为端侧数学推理、教育普惠与科研降本树立新标杆,陶哲轩公开点赞。
2025-02-18
模型评测与基准
OpenAI推出SWE-Lancer真实软件工程基准,多模态新基准让GPT-4o得零分;北大几何模型基于DeepSeek-Coder达IMO金牌水平,刷新国产AI科研上限。
2025-02-10
数学与科学AI超人类
谷歌AlphaGeometry2在IMO几何题击败金牌得主均值;DeepMind AlphaProof攻克奥赛最难试题;复旦4D扩散模型补全蛋白质动态结构;百奥几何生成式AI把抗体中和活性提升1000倍,AI正向基础科学深水区渗透。
2025-02-09
数学AI夺金突破符号推理极限
谷歌AlphaGeometry2在IMO几何题上拿到84%金牌级表现,结合辅助作图与符号引擎的新范式显著超越纯LLM,证明专用推理系统已逼近人类顶尖水平,为科学发现与自动形式化验证打开新空间。
2025-02-08
数学推理模型突破
DeepMind AlphaGeometry2、谷歌AI在IMO几何题正确率84%,超越金牌选手;李飞飞团队26分钟150元蒸馏出s1推理模型,验证“小参数+蒸馏”可行,预示高性能推理正走向低成本平民化。
2024-11-07
AI for Science模型突破
2100亿参数xTrimo V3生命科学大模型、达摩院“八观”公里级气象大模型、微软量子级蛋白动力学系统相继登上Nature/Science子刊,显示大模型正从NLP走向复杂系统模拟,精度提升1-2个量级,为药物设计、气候预测、材料发现打开新范式。
2024-09-25
多模态与视频生成突破
阿里MIMO图片驱动视频、生数Vidu API开放、字节版Sora论文再热,多模态生成从研究走向产品,降低创作门槛,UGC短视频、营销、动漫等内容产业迎生产力革命。
2024-07-27
数学推理AI突破
谷歌DeepMind的AlphaProof+AlphaGeometry 2在国际数学奥林匹克(IMO)6题中满分4题,19秒解几何,总分距金牌仅1分,首次证明AI可逼近人类顶级数学水平。该成果象征形式推理与强化学习结合的新高度,为科学发现与自动证明打开商业与学术空间。
2024-07-26
数学推理AI突破
谷歌DeepMind几何模型在IMO夺得银牌,19秒解出第4题;Mistral Large 2、Llama 3.1 405B等开源旗舰刷新数学与代码基准。AI在形式化推理上的进步标志科学计算与自动证明进入可用阶段。