谷歌即将发布的 Gemini 3.0 Pro 在内测中展现前端与 Web 编码能力飞跃,并率先把 MCP 协议集成到 CLI,开发者可一键调用,大幅降低配置门槛。同时 Nano Banana 开放 API、Gemini in Chrome 全面推送 Workspace,谷歌正围绕“模型+工具+生态”打出组合拳,意图在编程与生产力场景反超 OpenAI。
OpenAI 最新估值飙升至 5000 亿美元并创私企员工套现纪录,显示资本对其 AGI 路线的高度押注。同时,视频生成应用 Sora 上线四天即登顶美区 App Store,GPT-5 在电脑操作任务上仅落后人类 2%,模型能力与商业落地同步加速,进一步巩固其生态壁垒。
英伟达在 CoRL 大会一次性开源 Newton 物理引擎、Isaac GR00T N1.6 基础模型及 Cosmos 数据生成平台,与 Google DeepMind、迪士尼共建“物理直觉”生态;斯坦福 DexUMI 框架让机器人通过观察人手完成采茶、做早餐等精细任务,获最佳论文提名。仿真、数据、模型全链路开源将显著降低机器人研发门槛。
华中科大白翔团队提出 LIRA 框架,仅增两个轻量模块便将多模态大模型的分割与理解能力同时推至 SOTA,显著抑制幻觉并提升复杂场景下的像素级精度。该方法为自动驾驶、医疗影像等需要高精度视觉任务的行业提供了即插即用的新范式。
多家明星 AI 初创收入“有营收但非订阅”,高流失率暴露产品仍处实验阶段;红杉投资的 AI 设计工具被迫卖身 Perplexity 并宣布 90 天后关停,Supabase 却在“氛围编程”需求下一年三轮融资冲上 50 亿美元。行业冰火两重天,提示 AI 应用层正从概念验证走向残酷洗牌。
AI 系统在 17 小时内自主完成 30 页学术论文,从选题、实验到 APA 格式排版全程无人干预;陶哲轩用 GPT-5 仅写 29 行 Python 即解决数学难题。自生成科研内容的出现,既展示了模型推理与写作能力的飞跃,也引发对学术诚信与同行评审机制的深层讨论。