AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
PaperBench
相关话题
2025-04-04
自主智能体科研复现能力突破
OpenAI PaperBench首次让大模型完整复现ICML 2024论文,Claude 3.5以21%成功率遥遥领先,GPT-4o等模型仍难望其项背。AI自主阅读、实验、撰写全流程的“无人科研”雏形显现,或加速科学发现范式变革。
智能体复现
PaperBench
Claude 3.5
自主科研
科研自动化