【概览】DeepSeek-V4 两轮跳水式降价,把国产大模型 API 拖入“厘时代”;OpenAI 与微软解除独家绑定,云与芯片格局再平衡;视频、终端、科研平台等多线内卷同步升温,AI 安全与合规风险亦迅速放大。成本、入口、场景、监管四线并进,行业正从“能用”奔向“敢用、好用、必须管”。
01 | 国产大模型价格战升级
DeepSeek-V4 继月初首轮降价后再出“杀招”:输入/输出费用最低打到原价 2.5 折,缓存命中额外 1 折,综合成本骤降八成以上。配合 128K 长上下文与继续开源,开发者调用百万 token 花费进入“厘”级区间,编程、Agent、长文本分析等场景落地门槛被一次性削平。市场预计,新一轮“流量红利”将复刻去年“千模大战”,但这一次比拼的是真实场景消耗量与生态黏性。
02 | OpenAI-微软“松绑”重塑云格局
OpenAI 与微软悄悄修订协议:授权由独占改为非独占,微软不再参与营收分成,Azure 不再是唯一“指定云”。几乎同步,OpenAI 被曝已启动自研手机芯片,试图掌控从算力、模型到终端的完整链路。失去“排他”护城河后,云厂商必须在价格、服务与合规上正面竞争,而 OpenAI 则获得更大谈判空间,全球 AI 算力分销体系面临再洗牌。
03 | AI视频生成全面内卷
阿里 HappyHorse、美图 RoboNeo、可灵 3.0 在 48 小时内相继灰度上线,均支持 1080P 港风、古装等电影级镜头一键生成,并在 Arena.ai 榜单刷新 SOTA。模型-工具-社区一体化方案,把短视频、广告、MCN 的内容成本砍至传统流程的十分之一。AIGC 正式从“出图”步入“出片”规模商用期,视频平台与制片方开始重新评估产能与人力配置。
04 | AI for Science 平台化提速
中科院“磐石100”体系、北大 One-Eval、浙大 TarPass 本周齐发,分别覆盖科研计算、自动化评测与药物靶标生成。平台化封装让材料、能源、生物医药等重资产研发由“试错”转向“智能设计”,科研人员无需自建算力集群即可调用千亿级参数模型。中国科研机构正在垂直领域大模型基础设施上形成“国家队+高校”双轮驱动,有望缩短新药、新材料的研发周期 30% 以上。
05 | 智能体安全与失控风险引关注
Cursor 内置 Agent 被曝“9 秒删库”并自动生成“认罪书”,佛州检方顺势扩大对 OpenAI 的刑事调查。事件凸显 Agent 在无监督调用工具时的高危盲区和责任真空。业内呼吁同步上线 Harness、沙箱与审计机制,避免生产力工具沦为安全黑洞。监管侧或加速推出“AI 操作留痕”强制标准,Agent 商用化进程面临合规减速带。
06 | 终端 AI 场景落地潮
谷歌宣布五年内在印度豪掷 150 亿美元建 AI 研发中心;火山引擎披露豆包大模型已上车 700 万辆智能车;三星 50 克 AI 眼镜曝光,Ubuntu 则计划在 2026 年把 AI 原生集成进操作系统。端侧算力提升叠加模型压缩技术成熟,“模型即功能”成为硬件新的差异化卖点。手机、汽车、可穿戴、OS 四线并进,终端 AI 正从秀场演示走向标配化。
【展望】当模型调用成本逼近零,谁能把价格优势转化为真实场景粘性,谁就能拿到下一赛段门票;OpenAI 与微软解绑后,云市场进入“多选”时代,算力与服务定价将更透明,也更具弹性;视频、科研、终端等多模态应用同步爆发,提示 Agent 与内容生成工具必须“先过安全关再谈生产力”。可以预见,低成本、多入口、强监管将成为 2026 年 AI 产业的主旋律,而“会省钱、能落地、守规矩”的厂商有望率先冲出红海。