← 返回列表

AI行业新闻简报 2025.02.08 周六

📊 7 个话题 📰 23 条新闻 🕐 2025-02-08 05:30

【概览】国产大模型DeepSeek以“低价高智”横扫应用榜,下载量突破4000万并登顶中国日活,倒逼谷歌一日内连发Gemini 2.0全系新模型反击;与此同时,李飞飞团队用不足千条样本26分钟蒸馏出媲美o1-preview的推理模型,为行业提供“小数据大能力”新范式。资本端,亚马逊官宣2025年AI投入超千亿美元,百度万卡集群三折售卖算力,算力军备赛再度升温。

01 | DeepSeek现象级崛起

DeepSeek-R1自1月底上线后迅速成为全球增速最快的AI应用,仅两周多下载量即破4000万,日活超越豆包登顶中国榜首,并一度暂停API充值以缓解算力短缺。其“低成本+强推理”组合不仅激活了国产芯片、版权保护和仿冒域名等衍生生态,也被机构视为中国AGI的新名片,带动2029年本土生成式AI市场有望达98亿美元。

02 | Gemini 2.0全家桶反击

面对DeepSeek的凌厉攻势,谷歌在24小时内密集发布Gemini 2.0 Pro、Flash及Flash-Lite,全系原生多模态、2M长上下文与物理模拟能力刷新SOTA,并集体跻身大模型竞技场前十。Jeff Dean亲自站台,强调新系列在编程与复杂推理任务上“碾压级”优势,被视为对DeepSeek和ChatGPT的双线反击。

03 | 低成本推理范式

李飞飞联合上海交大团队用不到1000条样本与“预算强制”技术,在16张H100上仅用26分钟、成本约150元便蒸馏出性能媲美o1-preview的推理模型,挑战“数据越大越好”的传统Scaling Law。实验显示,817条高质量样本即可激发7倍推理性能提升,为中小机构参与大模型竞争提供了可复现的新范式。

04 | o3思维链公开

在社区对“黑盒”模型可解释性的持续呼吁下,OpenAI罕见公布o3-mini的完整思维链流程,尽管关键步骤仍被遮蔽,但已标志闭源阵营向透明化让步。业内人士普遍认为,DeepSeek开源策略的火爆是促使OpenAI让步的主要外力,未来模型透明或成竞争新维度。

05 | 资本与算力竞赛

亚马逊宣布2025年AI投入将超过1000亿美元,重点加码自研Trainium与推理芯片;百度首个自研万卡集群正式点亮,并以三折价格向市场提供DeepSeek专用算力。Cerebras与Mistral联手宣称在同等精度下训练速度超越DeepSeek,全球算力军备赛进入“万卡-千亿美元”量级的新阶段。

06 | AI安全与伦理警示

Hinton、Bengio等百余位顶尖学者联名发布报告,警告大模型可能在未来具备意识并体验痛苦,呼吁立即建立AI感知伦理框架。与此同时,马斯克旗下DOGE团队使用AI处理政府敏感数据引发隐私泄露争议,凸显技术落地与公共信任之间的张力。

07 | 版权与数据保护进展

武汉法院判决全国首例AI生成图片著作权案,认定创作者享有版权并获赔;谷歌同步推出数字水印功能,OpenAI亦宣布将在欧洲本地存储客户数据。司法与平台双轨并进,为AIGC版权归属与跨境合规提供落地样本。

【展望】DeepSeek的“低成本风暴”不仅改写了用户端格局,也迫使谷歌、OpenAI等巨头在模型性能、透明度和算力投入三线反击;当“小数据大能力”成为新研究范式,叠加千亿美元级资本支出,2025年大模型竞争将同时围绕“效率、解释性与伦理”展开,行业或迎来技术普惠与监管框架同步加速的拐点。

× 公众号二维码

扫码关注公众号获取每日简报