← 返回列表

AI行业新闻简报 2025.01.30 周四

📊 6 个话题 📰 19 条新闻 🕐 2025-01-30 05:30

【概览】

中国团队DeepSeek在除夕夜连发Janus-Pro与R1两大开源模型,以“256张A100+两周训练”颠覆算力神话,市值风暴导致英伟达一夜蒸发6000亿美元;阿里、北大同步祭出多模态统一框架,国产模型在视觉理解与生成两端同时树立新标杆。具身智能、RAG落地与AI4Science进展齐头并进,行业共识正从“堆算力”转向“算法创新+场景深耕”。

01 | DeepSeek冲击波

DeepSeek开源Janus-Pro多模态模型与R1纯强化学习推理模型,7B参数在文生图基准上超越DALL-E 3与Stable Diffusion,以不到主流方案1/10的训练成本刷新性能天花板;其“绕过CUDA”的工程细节更直接冲击英伟达护城河,引发美股科技板块历史性震荡,被谷歌前CEO评价为“全球AI竞赛进入新阶段”。

02 | 阿里Qwen视觉升级

阿里云通义在除夕夜同步开源Qwen2.5-VL系列(3B/7B/72B)与MoE架构的Qwen2.5-Max,7B模型在MMMU、DocVQA等视觉理解基准上超越GPT-4o-mini与Claude 3.5,首次实现单模型百万级Token长视频解析;多尺寸策略兼顾端侧与云端,进一步巩固国产开源大模型领先地位。

03 | 多模态统一框架

北大VARGPT与DeepSeek Janus-Pro先后采用“自回归统一架构”,用同一套参数完成视觉理解与生成,终结“理解模型+扩散模型”双轨制;单模型端到端方案显著降低推理与维护成本,“一个模型同时看与画”的新范式正在形成。

04 | 人形机器人上春晚

宇树科技H1人形机器人亮相央视春晚《秧Bot》节目,19关节高自由度驱动下完成扭秧歌、转手绢等高难度动作,实时平衡算法与民族舞蹈融合,首次在亿级观众场景验证国产机器人运动控制稳定性,具身智能迎来破圈级关注。

05 | RAG技术再进化

清华NLP开源“一键式”RAG框架,自动匹配向量库与生成模型,无需微调即可在政务、金融等知识密集型场景把幻觉率降低40%;行业实践显示,检索增强已成为大模型落地刚需,正推动“模型即服务”向“知识即服务”升级。

06 | AI for Science新进展

澳门大学联合复旦大学利用AI加速脂质纳米颗粒筛选,将mRNA递送实验周期从数月压缩至数天;北师大提出“因果涌现可逆性”理论,用AI揭示复杂系统时间对称性规律,显示生成式模型在基础科学领域持续输出新工具与新认知。

【展望】

当“低成本+高性能”成为中国开源模型的集体标签,全球AI竞赛的焦点正从算力堆砌转向算法与工程创新;多模态统一框架、RAG落地套件与具身智能场景化演示,将加速AI在内容创作、知识管理、实体经济的渗透。预计下一阶段,围绕推理效率、端侧部署与科学发现的生态竞争将愈演愈烈,开源力量或将在标准制定与商业落地两端同时掌握话语权。

× 公众号二维码

扫码关注公众号获取每日简报