Cursor被曝套壳国产Kimi、新基准BeyondSWE显示顶尖模型真实工程通过率不足45%,叠加初级开发者失业隐忧,AI编程从“神迹”回归理性,行业开始重新评估大模型在复杂软件工程中的真实边界与替代节奏。
MIT团队把可编程计算机嵌入Transformer,实现9.11>9.9等逻辑题100%正确,数独秒解,证明“概率式大模型+确定性计算”可弥补纯统计推理缺陷,为走向可验证、可信赖的通用推理提供新范式。
从北航开源OpenClaw防御高权限Skill攻击,到CSET预警AI智能体对数据治理框架的冲击,全球监管机构与学界同步关注Agent的权限滥用、跨平台数据流动和法规滞后问题,安全与合规成为Agent大规模落地前的必答题。
国内人形机器人企业突破140家,汽车、手机、电商巨头跨界入局,但机器人大模型成熟度低、高质量训练数据匮乏制约“能走”到“会思考”。谁能率先突破数据与模型瓶颈,将定义下一代具身智能标准。
杨立昆等指出当前AI系统部署后学习策略即冻结,缺乏儿童般的自主注意力与持续更新能力,每次适配都需人工重新训练。实现真正的自监督、持续学习被视为迈向下一代AI的核心门槛。
CLOUD晶体基础模型融合物理对称性,小样本跨任务预测材料性质;机器学习系统从近千种芳香植物中锁定靶向GABA_A受体的天然助眠分子。AI正成为加速新材料与天然药物发现的通用工具。
Claude Cowork推出Dispatch手机远控电脑功能,实现跨设备任务自动化,标志本地Agent从概念走向日常生产力工具,为知识工作者全流程无干预办公提供新范式。