【概览】5月14日,国产20B级多模态大模型一日内连刷38项SOTA,首次在GUI代理、3D生成等场景实现“即插即用”;同时,AI医疗、搜索入口、端侧记忆与编程助手全线升级,显示大模型竞争正从“参数军备”转向“场景深耕”。算力地缘博弈亦同步升温,中东成为新一轮AI基础设施热土。
01 | 国产多模态大模型爆发
字节Seed1.5-VL、阶跃Step1X-3D、清华-AgentCPM-GUI在同日开源或上线,以20B激活参数拿下38项SOTA,覆盖中文GUI操作、3D资产生成与复杂视觉问答,首次验证“小而强”路线可在消费级显卡部署,标志国产大模型进入多模态实用阶段。
02 | AI医疗与科学发现
OpenAI发布HealthBench,o3在5000道临床考题中得分逼近人类医生;Nature子刊上线DiffSMol,1秒生成可通过FDA筛选标准的候选药物;谷歌AlphaEvolve借助Gemini自动进化出超越人类基准的编码算法,显示大模型开始自主产出可验证的科学知识。
03 | AI搜索与浏览器变局
Perplexity以140亿美元估值再融5亿美元,并宣布年内推出自研AI浏览器,直接对标Chrome;谷歌测试“AI Mode”一键替代经典“手气不错”,将搜索结果页彻底改为多轮对话形态,AI答案即服务成为巨头新战场。
04 | 端侧AI与记忆协议
OpenMemory MCP协议开源,实现Claude、Cursor等工具100%本地共享记忆;苹果Matrix3D用三张照片实时重建3D场景,谷歌AI眼镜原型把Gemini压缩到终端,预示“无界面”端侧AI体验即将普及。
05 | 视频/3D生成新范式
PixVerse V4.5上线20余种电影级镜头模板,5秒生成可直投广告的成片;港中文T2I-R1把“先推理再下笔”引入文生图,国产交互式世界模型实时生成可玩《我的世界》,视觉AIGC进入“可导演、可交互”阶段。
06 | 芯片出口与地缘博弈
特朗普团队计划废除AI芯片三级出口管制,转而用1.8万块H100换取中东数据主权合作;OpenAI同步宣布在阿联酋建设新数据中心,算力资源正成为国家间新的谈判筹码。
07 | 编程助手国产化
腾讯CodeBuddy、Devv2.0、阿里妈妈AIGB同日开启公测,均支持中文语境与私域代码库,内置业务出价Agent,直接对标Cursor与GitHub Copilot,国产“AI编程+行业业务”双轮生态加速成型。
【展望】国产“小而强”多模态模型验证参数效率与场景深度可兼得,预计触发更多垂直行业快速落地;HealthBench、DiffSMol等科学基准与工具的出现,将加速AI成为研究基础设施;搜索、浏览器与端侧记忆的同步重构,则预示人机交互正从“关键词”迈向“对话+行动”一体化。随着中东算力枢纽升温,全球AI供应链或迎来新一轮地缘重组,企业需同步布局技术与合规双路线图。