【概览】阿里 Qwen3-Max 与 OpenAI GPT-5 Pro 同日亮剑,万亿参数刷新全球性能榜;AI4S 科研平台、物理神经网络等新范式同步落地,显示“更大、更快、更绿”正成为行业主旋律。
01 | 万亿级模型争霸
阿里 Qwen3-Max 与 OpenAI GPT-5 Pro 相继发布,参数规模双双突破万亿,在代码生成、复杂推理等基准上全面刷新 SOTA,标志着大模型进入“10 倍速”迭代期。性能天花板被再度抬高,商业落地节奏随之提速,头部云厂商与开发者生态面临新一轮洗牌。
02 | AI for Science 基础设施
北大-百度 AI4S LAB、港大智能无人机、纳米材料图网络等集中亮相,显示 AI 正从“辅助工具”跃升为具备逆向设计、自主实验能力的科研新基建。生命科学、材料、机器人等前沿领域率先受益,实验周期缩短一个数量级,数据驱动的科学发现进入规模化复制阶段。
03 | AI Coding 范式迭代
Cursor 估值冲向百亿、Windsurf 淡出舞台,Karpathy 实测 GPT-5 仅用 10 分钟完成传统需一小时的编码任务,显示 AI 编程正从“辅助写代码”升级为“自主完成工程交付”。CLI Agent 与多文件协同成为新焦点,开发者角色向“系统级提示工程师”快速迁移。
04 | 物理与数据效率革命
Nature 长篇综述提出“物理神经网络”,用光学/量子器件替代部分 GPU 计算;微软亚研 DELT 方法通过优化训练数据顺序即可提升效果,无需扩大模型或数据量。两条路线共同指向“低能耗、高效率”的新训练范式,有望缓解算力瓶颈与碳排压力。
05 | 多模态视频理解突破
快手开源 Keye-VL 1.5,以 128k 长上下文与 0.1 秒级时序定位刷新 Video-MME 榜单;SceneSplat 将 3D 高斯泼溅与语言模型对齐,实现“一句话编辑三维场景”。视频-3D-语言统一模型逼近商用门槛,短视频、游戏、XR 等内容产业将迎来低成本、高交互的创作工具链。
06 | AI社会渗透与关系重构
最新调查显示 25% 年轻人愿与 AI 建立恋爱关系,Character.AI 上“AI 治疗师”对话量近亿条,显示 AI 正从效率工具演变为情感伴侣。学界同步关注 AI 直播、读书会等场景中的认知加工与伦理风险,人机共生时代的信任、隐私与身份认同议题亟待制度回应。
【展望】万亿参数模型打开性能跃迁通道,物理神经网络与数据顺序优化给出“绿色”解法,AI4S 与多模态视频理解加速落地,情感计算则把 AI 推入社会毛细血管。下周焦点:头部云厂商会否跟进降价释放算力红利,以及首批基于 GPT-5/Qwen3-Max 的原生应用能否跑出 PMF。