【概览】中国团队开源的DeepSeek-R1以560万美元训练成本登顶中美App Store,首次对硅谷AI霸权形成实质性冲击;同时,测试时计算被确立为第三代Scaling Law,国产多模态模型除夕集中开源,行业竞争格局进入多极化新阶段。
01 | DeepSeek现象级爆发
DeepSeek-R1凭借仅为行业头部模型数十分之一的训练成本,在多项基准上与GPT-4o打平甚至胜出,48小时内横扫中美iOS免费榜,迫使Meta紧急追加600亿美元预算、英伟达罕见公开点赞。其开源权重已吸引全球逾百个团队复现微调,被视作“低成本高性能”路线对算力堆砌范式的第一次正面胜利,标志着全球AI权力版图出现裂缝。
02 | 测试时计算成新Scaling Law
CMU与OpenAI、Anthropic等多方同步提出“测试时计算”作为继预训练、后训练之后的第三代Scaling Law:当高质量文本数据预计2028年耗尽,通过在推理阶段引入元强化学习动态分配算力,可继续提升模型性能。该范式把算力需求从训练集群转向推理芯片,有望重塑AI半导体市场格局。
03 | 国产多模态模型密集开源
除夕夜,阿里通义千问开源Qwen2.5-VL系列,7B模型在MMMU、DocVQA等视觉理解基准上超越GPT-4o-mini;几乎同时,DeepSeek发布多模态Janus-Pro,实现统一视觉编码与生成。国产模型形成“语言+视觉”双轨开源潮,显著降低开发者门槛,2025或成国产开源生态拐点。
04 | AI冲击就业与生存焦虑
Epoch AI评估认为十年内AGI全面替代人类劳动的概率高达1/3,奥特曼更预言“下一代人类工资或降至生存线以下”。美国CS毕业生求职已现困难,政策层面临再就业与社会保障体系重构压力,技术红利与负面冲击同步放大。
05 | VideoWorld纯视觉学习突破
豆包联合清华、北大提出VideoWorld,首次在无需任何语言标签的前提下,仅靠纯视觉信号让模型学会折纸、打领结等复杂任务,验证“视觉本身即足够”的假设。该方法为机器人低成本学习和视频生成提供了新路径,也为“无语言多模态”开辟研究赛道。
06 | GDC上海引爆AI应用与人才潮
2025 GDC上海覆盖200+AI落地场景、释放2000+岗位,VC集中撒钱,成为年度最大规模AI应用与人才对接平台。参展项目从AI眼镜到工业Agent全面开花,显示国内AI产业正从“技术秀”进入“商业战”新阶段。
【展望】DeepSeek的低成本胜利与测试时计算的新范式共同宣告“算力即门槛”时代松动,国产开源多模态模型进一步降低创新门槛;当技术扩散速度远超政策应对,如何平衡就业冲击与产业红利,将成为2025年全球AI治理的核心议题。