DeepSeek-V4、GPT-5.5同日发布,实测性能对标甚至超越国际旗舰;百万token开源、长文本能力跃升,标志国产大模型从参数堆叠走向综合效率与工程落地,重塑全球竞争格局。
SimpleTES以“试错-反馈-进化”闭环横扫21项科学难题,ICLR’26 Balanced Thinking在提升10%精度同时推理长度降35%,显示AI科研正从静态大模型转向动态迭代机制,加速科学发现。
南大&快手推出CodeTracer,无需重训即可精准定位代码Agent失败步骤,实现推理链、代码、执行反馈全过程透明化,为黑箱调试提供即插即用解决方案,显著提升AI程序员可靠性。
碳硅智慧发布DrugFlow 3.0,整合靶点发现、分子生成、ADMET预测与自动化实验,多智能体协同打造端到端AI药物研发平台;剑桥等综述确认AI代理正从辅助工具升级为自主决策参与者。
Google DeepMind Vision Banana验证“能生成即可理解”,兔展UniWorld国产模型硬刚GPT-Image-2,在文字渲染、复杂布局与真实感上实现突破,预示生成模型将成为通才视觉学习者。
LLM DNA行为谱系分析在ICLR’26提出,可精准追溯微调源头、识别隐藏血缘,为快速膨胀的大模型生态提供溯源、评估与治理新工具,助力合规与可信AI发展。