2025-12-31
多模态大模型竞速
谷歌Gemini-3-Pro在SuperCLUE-VLM榜单断层领先,国产商汤、豆包、Qwen3-VL紧随其后;阿里开源Qwen-Image、腾讯开源HY-Motion1.0文生3D动作模型,显示中美在视觉-语言-动作一体化赛道进入密集迭代期,直接决定下一代交互与内容生成标准。
2025-12-09
多模态大模型突破
原生多模态架构NEO、Gemini 3、GPT-5.2等新一代模型密集发布,实现视觉-语言-3D统一生成与推理,推动“零门槛”创作与交互,标志生成式AI进入全模态时代。
2025-12-07
谷歌Gemini 3高价争议
谷歌发布迄今最强Gemini 3 Deep Think,草图秒变可交互3D场景,创意能力惊艳业界,但付费定价在DeepSeek等开源冲击下被批“太贵”。该事件凸显闭源巨头与开源社区之间的性价比鸿沟,或加速企业客户转向更具成本优势的替代方案,倒逼谷歌调整商业策略。
2025-11-19
视频/3D 生成进入实时时代
AI 视频生成提速 30% 并支持细节随手编辑,字节 Seed 发布单 Transformer 任意视角 3D 重建模型 DA3,影眸 Rodin 获头部游戏大单,30 秒即可输出可交互 3D 资产,UGC 二创与粉丝经济迎来全新内容供给范式。
2025-11-14
世界模型3D生成大众化
李飞飞World Labs推出Marble公测,单图+一句话即可生成可交互3D世界,Pro版月费仅7元;华为投资极佳视界,国内首家物理AI世界模型公司再获亿元融资,3D内容生产门槛被彻底打穿,元宇宙基建迎来“GPT时刻”。
2025-11-13
空间智能与世界模型商用化
李飞飞World Labs发布首款3D世界模型Marble并开放免费版,可灵2.5Turbo上线“首尾帧”可控视频生成,宇树G1-D工作站实现人形机器人采集-训练-部署闭环,显示AI正从语言空间走向三维物理世界,空间智能进入可商用落地拐点。
2025-10-23
多模态大模型竞速
阿里Qwen、字节Seed 3D、腾讯WorldMirror等密集发布多模态/3D生成大模型,性能与落地场景全面内卷,推动AIGC进入3D与实时交互时代。
2025-09-28
机器人具身智能突破
谷歌 DeepMind 推出首个“具身推理”大模型 Gemini Robotics 1.5,实现零样本技能迁移;腾讯混元发布原生 3D 组件生成模型,让机器人“先思考再行动”,加速通用机器人和自动化落地。
2025-09-22
AI视频/3D生成进入落地爆发期
阿里开源Wan-Animate一张图生成动画并支持人物替换,YouTube发布AI视频生成与面部保护工具,Tripo等平台推动3.0原生工作流,标志生成式AI正从“能生成”走向“可生产”,大幅降低影视、游戏、设计行业的内容制作成本。
2025-08-20
超长视频与3D游戏生成突破
LongVie框架在生成长达分钟级连贯视频上刷新SOTA,解决镜头一致性与故事线难题;CombatVLA推出首个3D动作游戏专用VLA模型,在《黑神话》《只狼》中击败人类玩家。生成式AI从“看得懂”走向“玩得动”,打开影视、游戏UGC及互动内容新蓝海。
2025-08-17
3D生成与评估标准化
上海AI Lab联合复旦、清华推出层次化3D生成质量榜单,终结“Demo吸睛”式主观评测;2025年模型能力跃升但缺乏统一度量,行业急需可复现、可拆分的评估体系以支撑内容工业落地。
2025-08-16
机器人产业链集结
FAIR plus 2026发布会与多档标准评测亮相,3D生成质量榜单、提示词多样性技巧、宇树机器人“撞人逃逸”事件等,显示硬件-算法-场景全链条正加速标准化与商业化。
2025-08-13
国产大模型技术突围
华人团队用扩散模型将上下文潜力提升3倍,商汤发布国内首个“图文交错”多模态大模型日日新6.5,腾讯混元3D、52B视觉模型及阿里Qwen Code相继开源或免费,显示国产模型在3D生成、代码、多模态等细分赛道加速追赶并局部领先。
2025-08-11
多模态生成与3D/视频模型爆发
谷歌Genie 3、阿里Wan2.1-I2V-Flash、虚拟试穿Voost、图生视频SkyReels-A3等密集发布,实现秒级交互式3D世界、高保真纹理还原及语音对口型,显示多模态生成正从“可用”走向“好用”,重塑电商、影视、UGC内容生产链。
2025-08-03
3D生成与效率优化
Ultra3D框架实现“一键精细到毛发”的3D资产生成,腾讯混元开源MixGRPO将训练时间减半而性能提升,显示AIGC在高质量内容与训练效率两端同步突破,加速影视、游戏落地。
2025-08-02
3D与多模态生成突破
Ultra3D、Nexus-Gen V2、腾讯MixGRPO等模型在3D资产、图像生成/编辑/理解三合一方向取得SOTA,训练时间减半、成本降至几分钱,为游戏、影视、XR内容生产带来即时可用的新流水线。
2025-07-31
具身智能与3D生成落地
腾讯混元 3D 世界模型首个支持物理仿真并兼容 CG 管线;宇树推出 15.8 万元 31 自由度经济款人形;云深处展示工厂巡检机器人。3D 数据底座+低成本硬件让具身智能走出实验室,加速商业闭环。
2025-07-27
WAIC 2025重磅发布潮
世界人工智能大会集中释放中国AI“模型+场景”大礼包:商汤“悟能”具身平台、腾讯开源混元3D、京东升级JoyAI、阶跃Step 3、阿里三连发等十余款基础模型同台竞技,并同步开放数据与工具链,标志国产大模型进入“周级迭代”新阶段,加速应用落地与生态洗牌。
2025-07-27
AI for Science与3D生成
上海AI Lab开源科学多模态大模型Intern-S1、“磐石”科学基础大模型及分子之心10大蛋白解决方案同步发布,实现波谱场多模态理解、AI蛋白可编程设计;结合腾讯开源混元3D,科研加速与3D内容生产双双进入“模型驱动”时代。
2025-06-23
自主智能体与空间推理突破
月之暗面Kimi-Researcher、Kimi-2506及EmbodiedGen等模型首次赋予大模型人类级空间思维与3D环境生成能力,为机器人导航、科研自动化打开新场景。