← 返回列表

AI行业新闻简报 2025.04.07 周一

📊 8 个话题 📰 14 条新闻 🕐 2025-04-07 05:30

【概览】Meta深夜抛出原生多模态Llama 4,以MoE架构与千万级上下文重夺开源王座,直接改写大模型竞争剧本;与此同时,特朗普新关税令GPU供应链风声鹤唳,硅谷算力基建面临急冻。开源与闭源、模型与硬件、创新与政策在同一天正面冲撞,行业进入高度不确定的新周期。

01 | Llama 4开源颠覆格局

Meta毫无预警开源Llama 4系列,首次引入MoE架构并支持最长千万token上下文,竞技场分数反超DeepSeek,同精度下参数减半即可在单张H100运行。性能跃迁带动Meta AI高层洗牌,公司宣布年内还将发布2万亿参数“超大杯”,明确向外界宣示开源阵营重回巅峰,闭源模型溢价空间被进一步压缩。

02 | GPU供应链遭关税暴击

特朗普政府拟对进口GPU芯片加征高额关税,若落地将直接抬高数据中心与超算成本,全美AI基础设施面临断链风险。消息一出,科技巨头市值一夜蒸发逾百亿美元,美股创五年最大单日跌幅;豁免清单仍悬而未决,全球大模型训练与部署节奏被迫放缓,算力不确定性成为短期最大黑天鹅。

03 | DeepSeek推理Scaling突破

DeepSeek联合清华提出推理时Scaling策略,通过扩展奖励模型在线优化推理路径,在数学与代码任务上取得显著增益,为即将发布的R2模型预热。OpenAI CEO奥特曼迅速回应,称GPT-5将在数月内登场并采用类似方案,预示“推理Scaling”正成为大模型性能跃迁的下一条主赛道。

04 | Gemini 2.5 Pro定价受追捧

谷歌公布Gemini 2.5 Pro API价格后,调用量单日飙升三倍,高性能多模态能力与阶梯式计费策略击中开发者痛点。性价比优势迫使竞品重新评估定价模型,谷歌在B端市场的话语权随之增强,大模型商业化进入“性能+成本”双维度竞速阶段。

05 | Runway创纪录融资

生成式视频头部公司Runway完成3.08亿美元C轮 extension,估值突破30亿美元,刷新AIGC视频赛道融资纪录。资金将用于自研视频基座模型与影视级工具链,缩短传统特效制作周期90%,好莱坞与广告业需求激增,多模态生成进入商业化兑现期。

06 | AI交通与药物设计落地

广西高速清明假期上线AI大模型实时调度系统,依据车流、天气与事故数据动态调整限速与诱导,拥堵时长下降25%。同日,双扩散模型结合多目标优化在3D小分子药物设计中实现98%靶点匹配度,AI正深入公共治理与医药研发核心环节,验证大模型垂直场景价值。

07 | 端侧与推荐模型新进展

中科大与华为联合发布生成式推荐大模型,以昇腾NPU为核心在端侧实现毫秒级响应,完整认知框架同步开源;英伟达FoundationStereo以满分成绩被CVPR接收,双目深度估计误差低于1像素,为机器人与AR/VR提供高精度低成本感知方案,端侧智能进入“可用+开源”并行时代。

08 | Z世代AI使用报告

Soul研究院发布《2025 Z世代AI使用报告》,显示超九成年轻人工作学习高度依赖AI工具,人均拥有1.8个“AI朋友”,情感陪伴与创意协作成为新增高频场景。高接受度倒逼产品向人格化、多模态、社交化方向迭代,也为订阅制与虚拟社交商业模式提供数据支撑。

【展望】Llama 4的开源强势回归让“性能—成本—可控性”三角再度倾斜,短期内将刺激更多企业与政府拥抱开源方案;GPU关税阴云则提醒行业硬件自主与全球供应链韧性同样关键。随着推理Scaling、端侧高效部署与多模态生成逐步成熟,大模型竞争焦点正从“训练算力”转向“推理效率+场景落地”,下一轮洗牌或将由政策、成本与用户真实需求共同书写。

× 公众号二维码

扫码关注公众号获取每日简报