2025-01-30 AI简报 - AI快开门

【概览】

中国团队DeepSeek在除夕夜连发Janus-Pro与R1两大开源模型，以“256张A100+两周训练”颠覆算力神话，市值风暴导致英伟达一夜蒸发6000亿美元；阿里、北大同步祭出多模态统一框架，国产模型在视觉理解与生成两端同时树立新标杆。具身智能、RAG落地与AI4Science进展齐头并进，行业共识正从“堆算力”转向“算法创新+场景深耕”。

01 | DeepSeek冲击波

DeepSeek开源Janus-Pro多模态模型与R1纯强化学习推理模型，7B参数在文生图基准上超越DALL-E 3与Stable Diffusion，以不到主流方案1/10的训练成本刷新性能天花板；其“绕过CUDA”的工程细节更直接冲击英伟达护城河，引发美股科技板块历史性震荡，被谷歌前CEO评价为“全球AI竞赛进入新阶段”。

02 | 阿里Qwen视觉升级

阿里云通义在除夕夜同步开源Qwen2.5-VL系列（3B/7B/72B）与MoE架构的Qwen2.5-Max，7B模型在MMMU、DocVQA等视觉理解基准上超越GPT-4o-mini与Claude 3.5，首次实现单模型百万级Token长视频解析；多尺寸策略兼顾端侧与云端，进一步巩固国产开源大模型领先地位。

03 | 多模态统一框架

北大VARGPT与DeepSeek Janus-Pro先后采用“自回归统一架构”，用同一套参数完成视觉理解与生成，终结“理解模型+扩散模型”双轨制；单模型端到端方案显著降低推理与维护成本，“一个模型同时看与画”的新范式正在形成。

04 | 人形机器人上春晚

宇树科技H1人形机器人亮相央视春晚《秧Bot》节目，19关节高自由度驱动下完成扭秧歌、转手绢等高难度动作，实时平衡算法与民族舞蹈融合，首次在亿级观众场景验证国产机器人运动控制稳定性，具身智能迎来破圈级关注。

05 | RAG技术再进化

清华NLP开源“一键式”RAG框架，自动匹配向量库与生成模型，无需微调即可在政务、金融等知识密集型场景把幻觉率降低40%；行业实践显示，检索增强已成为大模型落地刚需，正推动“模型即服务”向“知识即服务”升级。

06 | AI for Science新进展

澳门大学联合复旦大学利用AI加速脂质纳米颗粒筛选，将mRNA递送实验周期从数月压缩至数天；北师大提出“因果涌现可逆性”理论，用AI揭示复杂系统时间对称性规律，显示生成式模型在基础科学领域持续输出新工具与新认知。

【展望】

当“低成本+高性能”成为中国开源模型的集体标签，全球AI竞赛的焦点正从算力堆砌转向算法与工程创新；多模态统一框架、RAG落地套件与具身智能场景化演示，将加速AI在内容创作、知识管理、实体经济的渗透。预计下一阶段，围绕推理效率、端侧部署与科学发现的生态竞争将愈演愈烈，开源力量或将在标准制定与商业落地两端同时掌握话语权。

AI快开门

发现AI的无限可能