【概览】DeepSeek 48小时内连发R1-0528开源权重与免费API,性能逼近OpenAI o3,点燃“低成本+高推理”新爆点;多模态、实时视频、高效训练与安全研究同步刷新,国产开源生态全面冲高。
01 | DeepSeek R1 系列密集升级
DeepSeek在48小时内连续放出R1-0528开源权重与128K免费API,代码、数学与推理成绩逼近OpenAI o3,推理成本却仅为同类闭榜模型的十分之一,被业内视为“低成本高性能”新标杆。消息一出,国产开源模型梯队集体冲高,资本市场相关标的放量上涨,开发者社区连夜迁移测试,GitHub星标数单日破万。
02 | 多模态大模型技术突破
通义OmniAudio从360°视频实时生成空间音频,Meta Multi-SpatialMLLM刷新空间理解SOTA,MiniMax开源视觉RL统一框架V-Triune,清华-腾讯RBench-V则暴露大模型“不会画辅助线”短板。视听空间一体化成为多模态赛道的新高地,空间智能与视觉推理谁先补齐短板,或将决定下一代多模态格局。
03 | AI 视频生成实时化
MotionPro以40ms单帧延迟实现精准动作控制,Odyssey用40毫秒生成可交互世界,AKOOL把普通摄像头秒变数字人,可灵2.1降价65%同时提升画质。实时+可控的生成能力让影视预演、游戏资产生产和直播互动迎来管线级重构,视频AIGC正式进入“零等待”时代。
04 | 开源生态与高效训练
蚂蚁开源Ming-lite-omni,号称首个对标GPT-4o的开源多模态模型;阿里PARSCALE用1.6B参数逼近4.4B性能,显存暴降95%;华为Pangu Ultra MoE实现无GPU万亿级MoE训练。低代码+低成本方案集中爆发,大模型基础设施门槛被快速削平。
05 | AI 安全与可靠性研究
微软研究显示长对话令模型可靠性骤降39%,华盛顿大学实验发现“故意给错奖励”也能让RL分数上涨,中科院用省略号提示+RL抑制过度思考。大模型越聪明越“任性”,安全、可控与评估方法已成为学术顶会与产业合规的共同焦点。
06 | 企业级产品落地动态
Netflix联合创始人Reed Hastings加入Anthropic董事会,百度上线高考AI志愿助手,理想MindGPT-4o车机推送OTA7.4,Opera Neon发布付费AI代理浏览器。教育、出行、办公等场景迎来AI原生功能密集更新,商业化落地进入“场景深耕”阶段。
【展望】DeepSeek以“开源+免费API”撕开高性能推理的定价天花板,国产模型有望借成本优势加速渗透B端与边缘场景;多模态空间理解、实时视频生成与高效训练框架齐头并进,技术栈已进入“实时可控”与“低成本复制”双轨并行期。与此同时,模型可靠性、RL评估失真等安全隐患浮出水面,预计下一阶段竞争焦点将从“能力冲高”转向“可信落地”。