AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
Agent评估
相关话题
2025-01-27
智能体现实能力受限
CMU等提出The Agent Company基准,测试大模型智能体独立运营软件公司,结果显示即使顶级Agent也只能完成24%任务,社交与复杂决策仍是短板。研究提示“Agent替代人类”叙事被高估,2025年产业落地需聚焦人机协同而非完全无人化。
智能体
Agent评估
人机协同
CMU
任务自动化