AI快开门
发现AI的无限可能
首页
工具
模型
模型历史
模型排名
模型价格
话题
简报
搜索
首页
工具
模型
话题
简报
搜索
← 返回话题列表
#
复杂推理
相关话题
2024-02-07
智能体规划能力瓶颈
复旦与OSU等团队评估GPT-4/Gemini做旅行规划,成功率仅0.6%,暴露大模型在复杂多步推理与工具调用上的短板。研究提醒行业:Agent落地需突破规划算法、记忆机制与外部反馈,否则难以胜任真实业务自动化。
GPT-4
Agent
任务规划
复杂推理
评估