← 返回列表

AI行业新闻简报 2025.01.23 周四

📊 6 个话题 📰 24 条新闻 🕐 2025-01-23 05:30

【概览】

1月22日,国产大模型阵营以开源形式密集刷新SOTA,豆包1.5 Pro、DeepSeek-R1、子曰-o1在多项基准上反超GPT-4o与Claude3.5,宣告“可用+可控”时代到来;美国则抛出5000亿美元“星际之门”计划,以国家级AI基建竞赛回应。两端同步升温,让2025年开年即进入“模型-算力-资本”三线并进的全面竞速。

01 | 国产大模型密集升级

字节跳动、网易有道与深度求索同日放榜:豆包1.5 Pro凭借7倍MoE杠杆在MMLU、MMMU等公开集超越GPT-4o,并强调“零蒸馏数据”训练;DeepSeek-R1开源32B与70B双版本,数学推理成绩追平OpenAI o1正式版;14B参数的子曰-o1亦以MIT协议示人,小模型复现复杂逻辑推理。三家均同步释放权重与推理API,国产大模型首次在“性能-成本-可控”三维度同时拉齐国际一线水准,标志中国自研底座进入开源即战力阶段。

02 | 5000亿美元Stargate计划

美国前总统特朗普与OpenAI、软银、甲骨文共同宣布“星际之门”项目,拟四年投入5000亿美元(首期1000亿美元即刻启动)建设10座超大规模AI算力园区,并承诺立即创造10万个就业岗位。项目明确优先支持AI癌症疫苗、个性化药物等医疗场景,被视作华盛顿对国产模型快速崛起的“国家级回应”。软银与甲骨文分别承担资金与云基础设施,OpenAI负责模型与软件栈,三方锁定“政府+巨头”联合模式,全球AI军备竞赛从芯片禁运升级到资本密集型基建对抗。

03 | AI制药进入临床倒计时

谷歌DeepMind CEO哈萨比斯确认,2025年底前将至少有一款完全由AI设计的药物进入I期临床;英伟达联合Innophore发布CavitOmiX,利用GPU加速口袋动力学模拟,把苗头化合物发现周期缩短至数周;北京大学团队基于语言模型的进化预测框架,在新冠、HIV与流感病毒抗原漂移任务上精度提升67%,为疫苗株提前选配提供决策。AI正从“辅助设计”走向“主导发明”,制药行业核心R&D链条被重新书写。

04 | 模型蒸馏与评测反思

中科院、北大联合实验显示,除Claude、Gemini、豆包等少数模型外,市面主流开源模型普遍“过度蒸馏”,导致泛化误差放大、长链推理崩溃;人大与清华提出Search-o1框架,在推理阶段引入自主搜索,与外部知识实时对齐,将MATH数据集的幻觉率从18.4%降至4.2%。研究呼吁行业升级“动态评测+白盒蒸馏”标准,为下一轮模型可信性竞赛奠定方法论。

05 | 终端AI与硬件创新

成都华微16 TOPS AI芯片率先小批量试产,功耗8 W即可跑通7B模型推理,面向本地工业视觉与车载算力;光波连接(Photonic Wire Bonding)芯片方案在8卡节点实现1.8 TB/s裸眼带宽,训练GPT-3级模型时间缩短27%;AI耳机厂商未来智能完成数千万元Pre-A轮融资,主打离线语音翻译与实时会议速记。高算力、低功耗与光互连的协同落地,为2025年终端智能化铺平道路。

06 | 内容生成工具井喷

腾讯开源3D生成大模型2.0,支持自动绑骨与分钟级游戏资产输出;快手可灵上线“多图参考”功能,一次可融合4张人像生成多主角视频;微信秒剪新增AI漫画风与公众号一键转视频;商汤“秒画趣拍”借新年档期提供个性化写真。多模态AIGC工具链从2D图像、3D资产延伸到视频与社交内容,创作门槛进一步降低,内容生态面临新一轮供给冲击。

【展望】

当国产模型以开源姿态逼近甚至超越闭源标杆,美国迅速以“星际之门”级别基建投资拉响国家竞赛警报,全球AI进入“性能-资本-供应链”三线对抗的新周期。与此同时,AI制药走向临床、端侧芯片点亮16 TOPS算力、多模态创作工具链趋于完整,预示2025年行业将从“技术突破”全面迈向“产业落地”。下一步焦点将集中在:开源生态如何持续迭代、万亿级基建能否兑现就业与医疗红利,以及评测与蒸馏新标准能否为模型可信度保驾护航。

× 公众号二维码

扫码关注公众号获取每日简报