2026-01-18

具身智能与机器人进展

UC伯克利新研究让机器人首次可靠使用洗碗机,展示多模态感知与长时序任务规划的突破;硬件+大模型融合加速家庭与服务业落地,为2026具身智能商业化打开想象空间。
2024-07-13

大模型推理与规划突破

OpenAI内部代号为「草莓」的新模型首次公开,强调强推理、长程任务规划与超大规模训练,并同步提出AGI分级框架,被视为迈向通用人工智能的关键节点,可能重塑行业研发路线与评估标准。
2024-02-07

智能体规划能力瓶颈

复旦与OSU等团队评估GPT-4/Gemini做旅行规划,成功率仅0.6%,暴露大模型在复杂多步推理与工具调用上的短板。研究提醒行业:Agent落地需突破规划算法、记忆机制与外部反馈,否则难以胜任真实业务自动化。