2025-01-23 AI简报 - AI快开门

【概览】

1月22日，国产大模型阵营以开源形式密集刷新SOTA，豆包1.5 Pro、DeepSeek-R1、子曰-o1在多项基准上反超GPT-4o与Claude3.5，宣告“可用+可控”时代到来；美国则抛出5000亿美元“星际之门”计划，以国家级AI基建竞赛回应。两端同步升温，让2025年开年即进入“模型-算力-资本”三线并进的全面竞速。

01 | 国产大模型密集升级

字节跳动、网易有道与深度求索同日放榜：豆包1.5 Pro凭借7倍MoE杠杆在MMLU、MMMU等公开集超越GPT-4o，并强调“零蒸馏数据”训练；DeepSeek-R1开源32B与70B双版本，数学推理成绩追平OpenAI o1正式版；14B参数的子曰-o1亦以MIT协议示人，小模型复现复杂逻辑推理。三家均同步释放权重与推理API，国产大模型首次在“性能-成本-可控”三维度同时拉齐国际一线水准，标志中国自研底座进入开源即战力阶段。

02 | 5000亿美元Stargate计划

美国前总统特朗普与OpenAI、软银、甲骨文共同宣布“星际之门”项目，拟四年投入5000亿美元（首期1000亿美元即刻启动）建设10座超大规模AI算力园区，并承诺立即创造10万个就业岗位。项目明确优先支持AI癌症疫苗、个性化药物等医疗场景，被视作华盛顿对国产模型快速崛起的“国家级回应”。软银与甲骨文分别承担资金与云基础设施，OpenAI负责模型与软件栈，三方锁定“政府+巨头”联合模式，全球AI军备竞赛从芯片禁运升级到资本密集型基建对抗。

03 | AI制药进入临床倒计时

谷歌DeepMind CEO哈萨比斯确认，2025年底前将至少有一款完全由AI设计的药物进入I期临床；英伟达联合Innophore发布CavitOmiX，利用GPU加速口袋动力学模拟，把苗头化合物发现周期缩短至数周；北京大学团队基于语言模型的进化预测框架，在新冠、HIV与流感病毒抗原漂移任务上精度提升67%，为疫苗株提前选配提供决策。AI正从“辅助设计”走向“主导发明”，制药行业核心R&D链条被重新书写。

04 | 模型蒸馏与评测反思

中科院、北大联合实验显示，除Claude、Gemini、豆包等少数模型外，市面主流开源模型普遍“过度蒸馏”，导致泛化误差放大、长链推理崩溃；人大与清华提出Search-o1框架，在推理阶段引入自主搜索，与外部知识实时对齐，将MATH数据集的幻觉率从18.4%降至4.2%。研究呼吁行业升级“动态评测+白盒蒸馏”标准，为下一轮模型可信性竞赛奠定方法论。

05 | 终端AI与硬件创新

成都华微16 TOPS AI芯片率先小批量试产，功耗8 W即可跑通7B模型推理，面向本地工业视觉与车载算力；光波连接（Photonic Wire Bonding）芯片方案在8卡节点实现1.8 TB/s裸眼带宽，训练GPT-3级模型时间缩短27%；AI耳机厂商未来智能完成数千万元Pre-A轮融资，主打离线语音翻译与实时会议速记。高算力、低功耗与光互连的协同落地，为2025年终端智能化铺平道路。

06 | 内容生成工具井喷

腾讯开源3D生成大模型2.0，支持自动绑骨与分钟级游戏资产输出；快手可灵上线“多图参考”功能，一次可融合4张人像生成多主角视频；微信秒剪新增AI漫画风与公众号一键转视频；商汤“秒画趣拍”借新年档期提供个性化写真。多模态AIGC工具链从2D图像、3D资产延伸到视频与社交内容，创作门槛进一步降低，内容生态面临新一轮供给冲击。

【展望】

当国产模型以开源姿态逼近甚至超越闭源标杆，美国迅速以“星际之门”级别基建投资拉响国家竞赛警报，全球AI进入“性能-资本-供应链”三线对抗的新周期。与此同时，AI制药走向临床、端侧芯片点亮16 TOPS算力、多模态创作工具链趋于完整，预示2025年行业将从“技术突破”全面迈向“产业落地”。下一步焦点将集中在：开源生态如何持续迭代、万亿级基建能否兑现就业与医疗红利，以及评测与蒸馏新标准能否为模型可信度保驾护航。

AI快开门

发现AI的无限可能