2026-04-16
世界模型开源潮
阿里Happy Oyster、腾讯混元3D 2.0、World Labs Spark 2.0等相继开源,支持文本/图像一键生成可交互3D世界,打通游戏与AR工作流,预示“AI造世界”进入免费工具时代。
2026-03-30
AI视频/3D创作平民化
Runway Multi-Shot一键电影级短片、Claude手搓3D建筑编辑器、爱奇艺纳逗Pro打通剧本到成片,降低专业创作门槛,年费数万美金软件面临免费网页工具冲击,AI重塑影视与建筑工业化流程。
2025-12-31
多模态大模型竞速
谷歌Gemini-3-Pro在SuperCLUE-VLM榜单断层领先,国产商汤、豆包、Qwen3-VL紧随其后;阿里开源Qwen-Image、腾讯开源HY-Motion1.0文生3D动作模型,显示中美在视觉-语言-动作一体化赛道进入密集迭代期,直接决定下一代交互与内容生成标准。
2025-12-09
多模态大模型突破
原生多模态架构NEO、Gemini 3、GPT-5.2等新一代模型密集发布,实现视觉-语言-3D统一生成与推理,推动“零门槛”创作与交互,标志生成式AI进入全模态时代。
2025-12-07
谷歌Gemini 3高价争议
谷歌发布迄今最强Gemini 3 Deep Think,草图秒变可交互3D场景,创意能力惊艳业界,但付费定价在DeepSeek等开源冲击下被批“太贵”。该事件凸显闭源巨头与开源社区之间的性价比鸿沟,或加速企业客户转向更具成本优势的替代方案,倒逼谷歌调整商业策略。
2025-11-19
视频/3D 生成进入实时时代
AI 视频生成提速 30% 并支持细节随手编辑,字节 Seed 发布单 Transformer 任意视角 3D 重建模型 DA3,影眸 Rodin 获头部游戏大单,30 秒即可输出可交互 3D 资产,UGC 二创与粉丝经济迎来全新内容供给范式。
2025-11-14
世界模型3D生成大众化
李飞飞World Labs推出Marble公测,单图+一句话即可生成可交互3D世界,Pro版月费仅7元;华为投资极佳视界,国内首家物理AI世界模型公司再获亿元融资,3D内容生产门槛被彻底打穿,元宇宙基建迎来“GPT时刻”。
2025-11-13
空间智能与世界模型商用化
李飞飞World Labs发布首款3D世界模型Marble并开放免费版,可灵2.5Turbo上线“首尾帧”可控视频生成,宇树G1-D工作站实现人形机器人采集-训练-部署闭环,显示AI正从语言空间走向三维物理世界,空间智能进入可商用落地拐点。
2025-10-23
多模态大模型竞速
阿里Qwen、字节Seed 3D、腾讯WorldMirror等密集发布多模态/3D生成大模型,性能与落地场景全面内卷,推动AIGC进入3D与实时交互时代。
2025-09-28
机器人具身智能突破
谷歌 DeepMind 推出首个“具身推理”大模型 Gemini Robotics 1.5,实现零样本技能迁移;腾讯混元发布原生 3D 组件生成模型,让机器人“先思考再行动”,加速通用机器人和自动化落地。
2025-09-22
AI视频/3D生成进入落地爆发期
阿里开源Wan-Animate一张图生成动画并支持人物替换,YouTube发布AI视频生成与面部保护工具,Tripo等平台推动3.0原生工作流,标志生成式AI正从“能生成”走向“可生产”,大幅降低影视、游戏、设计行业的内容制作成本。
2025-08-20
超长视频与3D游戏生成突破
LongVie框架在生成长达分钟级连贯视频上刷新SOTA,解决镜头一致性与故事线难题;CombatVLA推出首个3D动作游戏专用VLA模型,在《黑神话》《只狼》中击败人类玩家。生成式AI从“看得懂”走向“玩得动”,打开影视、游戏UGC及互动内容新蓝海。
2025-08-17
3D生成与评估标准化
上海AI Lab联合复旦、清华推出层次化3D生成质量榜单,终结“Demo吸睛”式主观评测;2025年模型能力跃升但缺乏统一度量,行业急需可复现、可拆分的评估体系以支撑内容工业落地。
2025-08-16
机器人产业链集结
FAIR plus 2026发布会与多档标准评测亮相,3D生成质量榜单、提示词多样性技巧、宇树机器人“撞人逃逸”事件等,显示硬件-算法-场景全链条正加速标准化与商业化。
2025-08-13
国产大模型技术突围
华人团队用扩散模型将上下文潜力提升3倍,商汤发布国内首个“图文交错”多模态大模型日日新6.5,腾讯混元3D、52B视觉模型及阿里Qwen Code相继开源或免费,显示国产模型在3D生成、代码、多模态等细分赛道加速追赶并局部领先。
2025-08-11
多模态生成与3D/视频模型爆发
谷歌Genie 3、阿里Wan2.1-I2V-Flash、虚拟试穿Voost、图生视频SkyReels-A3等密集发布,实现秒级交互式3D世界、高保真纹理还原及语音对口型,显示多模态生成正从“可用”走向“好用”,重塑电商、影视、UGC内容生产链。
2025-08-03
3D生成与效率优化
Ultra3D框架实现“一键精细到毛发”的3D资产生成,腾讯混元开源MixGRPO将训练时间减半而性能提升,显示AIGC在高质量内容与训练效率两端同步突破,加速影视、游戏落地。
2025-08-02
3D与多模态生成突破
Ultra3D、Nexus-Gen V2、腾讯MixGRPO等模型在3D资产、图像生成/编辑/理解三合一方向取得SOTA,训练时间减半、成本降至几分钱,为游戏、影视、XR内容生产带来即时可用的新流水线。
2025-07-31
具身智能与3D生成落地
腾讯混元 3D 世界模型首个支持物理仿真并兼容 CG 管线;宇树推出 15.8 万元 31 自由度经济款人形;云深处展示工厂巡检机器人。3D 数据底座+低成本硬件让具身智能走出实验室,加速商业闭环。