李飞飞团队RTFM实现单卡实时3D世界生成,谷歌Gemini 3.0 Pro、百度PaddleOCR-VL等刷新OCR与推理纪录,开源LLaVA-OneVision-1.5登顶多模态榜单,显示视觉-语言-动作统一模型正快速走向实用化,为下一代交互与内容生产奠定基础。
OpenAI Sora 2上线Azure并定价0.1美元/秒,Pro版可生成25秒视频;谷歌Veo 3.1跟进升级,爱诗科技ARR超4000万美元、融资1亿元。巨头与初创共同推高视频AIGC产能,标志长时长、高一致性视频生成进入付费商用阶段。
清华长庚联合北电数智推出国内首个药学大模型,谷歌DeepMind发布C2S-Scale 27B癌症治疗路径模型,阿里妈妈推出淘宝星辰·图像编辑。医疗、电商、法律等场景出现专用大模型,强调行业知识与安全合规,加速AI在核心生产环节的渗透。
重庆下架十余款违规AI产品,纽约州立法禁止算法操控租金,OpenAI为历史人物形象保护暂停Sora生成马丁·路德·金视频。中美同步强化算法审查与数据合规,显示监管从倡议走向执法,成为产品上线必答题。
Anthropic为Claude新增Skills与Excel、PPT自动生成,微软把Copilot深度集成Windows 11,字节豆包1.6支持可调思考深度。头部厂商围绕办公、操作系统、搜索构建Agent级自动化能力,降低企业流程人力成本,推动AI从助手向数字员工演进。