AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
AIME
相关话题
2025-02-21
AI科研与数学推理升级
谷歌AI co-scientist独立提出可验证科研假设,普林斯顿ReasonFlux用500思维模板刷新奥数成绩,DeepSeek-R1通过步骤级对齐在AIME再提分,显示大模型在科研与数学深度推理上持续突破。
AI科研
数学推理
ReasonFlux
AIME
DeepSeek
2025-01-11
小模型数学推理突破o1
微软亚洲研究院rStar-Math算法让7B参数Qwen2.5在美国数学奥赛AIME 2024中得分53.3%,媲美全美前20%高中生,首次证明小模型通过自我进化+蒙特卡洛树搜索可超越大模型,为端侧推理与低成本科研开辟新范式。
小模型
数学推理
自我进化
AIME
蒙特卡洛树搜索