【概览】Claude一夜之间把上下文扩展到100万token,彻底改写AI编程范式;与此同时,OpenClaw“养虾”生态因漏洞频发被拉响国家级预警,Agent安全成为行业生死线。底层架构、评测基准、垂直应用与科研范式同步刷新,AI正从“能用”走向“敢用、好用、放心用”。
01 | Agent安全与治理
OpenClaw生态的“云养虾”热潮让Agent数量指数级增长,却伴随认证绕过、命令注入、密钥泄露等高危漏洞,已触发国家级预警。Nextie发布仅6.5KB的“卫士虾”TuanziGuard,用Agent对抗Agent,北师大课题组同步招募虚假信息治理人才,行业首次把“安全”写进Agent操作系统的前页。
02 | 超长上下文重塑编程
Claude将上下文窗口一口气推至100万token,可一次性“吞下”整个代码库,引爆“新编程范式”讨论。Cursor顺势发布CursorBench,直指旧基准与真实智能体工作流脱节,Claude Haiku得分从73.3骤降至29.4,标志着编程AI正式进入“长记忆+多步推理”时代,旧评测体系一夜过时。
03 | 垂直应用被大模型“一键清零”
Gemini驱动谷歌地图上线“Ask Maps”自然语言搜索与沉浸式导航,被业界惊呼“垂直应用全完蛋”。同日,OpenClaw发布全球首个医疗Agent OS——WiseClaw,打通支付、API、诊疗流程,中国医疗AI直接进入“Agent即操作系统”阶段,地图与医疗两大场景被大模型一次性重构。
04 | AI×Science范式升级
菲尔兹奖得主陶哲轩宣布创办SAIR Foundation并亲任联合创始人,目标直指AI赋能数学发现与形式化推理;同期“Vibe Modeling”读书会招募发起人,提出“用自然语言描述思想即可自动建模”,科研流程从“写代码”升级为“写思想”,AI×Science进入“零门槛”新范式。
05 | AI+生物计算走进临床
科技CEO用ChatGPT+基因数据定制癌症疫苗,临床试验肿瘤缩小50%,登上热搜;上海交大医学院庄友文课题组招聘博士后,专注GPCR靶向药物AI设计,已在Cell、Neuron等顶刊发表多篇成果,AI制药从算法验证正式迈向临床与制药核心环节。
06 | 底层架构与评测革新
哈工深提出模长感知线性注意力,显存直降92.3%;MIT新算法挑战“后训练RL已死”共识;CVPR 2026论文利用视觉Token变化量无损加速VLM 1.87倍;arXiv宣布脱离康奈尔大学独立并全球招聘CEO,底层算法、评测基准与知识分发体系同步洗牌,科研基础设施迎来大重构。
【展望】当上下文长度突破百万、Agent操作系统落地医疗、数学大师亲自下场重塑科研范式,AI已进入“能力爆表”与“风险高企”的双轨并行期。接下来,谁能率先解决超长记忆下的安全与可信问题,谁就能在下一个淘汰赛中拿到“免死金牌”。