3D生成 - AI话题 - AI快开门

2026-06-25

具身智能与物理AI突破

AI与物理世界交互成为新前沿。RoboScience发布Visics大模型赋予机器人通用“大脑”；影眸科技凭3D生成大模型完成数亿融资；Momenta以“物理AI第一股”冲刺港股；北大清华提出StableVLA显著提升机器人鲁棒性。标志AI正从数字世界向物理世界深度渗透。

具身智能世界模型 3D生成机器人 VLA

2026-05-26

AI内容创作与3D生成

AIGC技术向专业化与工业化迈进，Hyper3D发布全球首款千万面级3D生成模型Rodin Gen-2.5；商汤Seko AI重塑漫短剧生产，AIGCPanel 2.0实现数字人一键化创作，游戏AI从提效工具升级为体验重塑者。

3D生成 AIGC 数字人 Rodin Gen-2.5 游戏AI

2026-04-23

3D与多模态生成突破

字节Seed3D2.0、GPT-Image2、Elephant Alpha等模型在几何精度、图像真实感和Token效率上刷新SOTA，3D内容生产与多模态创作进入“生产级可用”阶段，加速元宇宙、游戏、影视制作升级。

3D生成多模态 GPT-Image Seed3D SOTA

2026-04-16

世界模型开源潮

阿里Happy Oyster、腾讯混元3D 2.0、World Labs Spark 2.0等相继开源，支持文本/图像一键生成可交互3D世界，打通游戏与AR工作流，预示“AI造世界”进入免费工具时代。

世界模型 3D生成开源阿里腾讯

2026-03-30

AI视频/3D创作平民化

Runway Multi-Shot一键电影级短片、Claude手搓3D建筑编辑器、爱奇艺纳逗Pro打通剧本到成片，降低专业创作门槛，年费数万美金软件面临免费网页工具冲击，AI重塑影视与建筑工业化流程。

AI视频 3D生成 Runway 纳逗Pro 创作平民化

2025-12-31

多模态大模型竞速

谷歌Gemini-3-Pro在SuperCLUE-VLM榜单断层领先，国产商汤、豆包、Qwen3-VL紧随其后；阿里开源Qwen-Image、腾讯开源HY-Motion1.0文生3D动作模型，显示中美在视觉-语言-动作一体化赛道进入密集迭代期，直接决定下一代交互与内容生成标准。

多模态 Gemini 国产大模型视觉语言模型 3D生成

2025-12-09

多模态大模型突破

原生多模态架构NEO、Gemini 3、GPT-5.2等新一代模型密集发布，实现视觉-语言-3D统一生成与推理，推动“零门槛”创作与交互，标志生成式AI进入全模态时代。

多模态 Gemini 3 GPT-5.2 NEO 3D生成

2025-12-07

谷歌Gemini 3高价争议

谷歌发布迄今最强Gemini 3 Deep Think，草图秒变可交互3D场景，创意能力惊艳业界，但付费定价在DeepSeek等开源冲击下被批“太贵”。该事件凸显闭源巨头与开源社区之间的性价比鸿沟，或加速企业客户转向更具成本优势的替代方案，倒逼谷歌调整商业策略。

Gemini 3 3D生成定价争议开源冲击

2025-11-19

视频/3D 生成进入实时时代

AI 视频生成提速 30% 并支持细节随手编辑，字节 Seed 发布单 Transformer 任意视角 3D 重建模型 DA3，影眸 Rodin 获头部游戏大单，30 秒即可输出可交互 3D 资产，UGC 二创与粉丝经济迎来全新内容供给范式。

AI视频 3D生成实时编辑字节Seed Rodin

2025-11-14

世界模型3D生成大众化

李飞飞World Labs推出Marble公测，单图+一句话即可生成可交互3D世界，Pro版月费仅7元；华为投资极佳视界，国内首家物理AI世界模型公司再获亿元融资，3D内容生产门槛被彻底打穿，元宇宙基建迎来“GPT时刻”。

世界模型 3D生成李飞飞 Marble 华为

2025-11-13

空间智能与世界模型商用化

李飞飞World Labs发布首款3D世界模型Marble并开放免费版，可灵2.5Turbo上线“首尾帧”可控视频生成，宇树G1-D工作站实现人形机器人采集-训练-部署闭环，显示AI正从语言空间走向三维物理世界，空间智能进入可商用落地拐点。

空间智能世界模型 3D生成人形机器人可控视频

2025-10-23

多模态大模型竞速

阿里Qwen、字节Seed 3D、腾讯WorldMirror等密集发布多模态/3D生成大模型，性能与落地场景全面内卷，推动AIGC进入3D与实时交互时代。

多模态 3D生成 Qwen Seed 3D WorldMirror

2025-09-28

机器人具身智能突破

谷歌 DeepMind 推出首个“具身推理”大模型 Gemini Robotics 1.5，实现零样本技能迁移；腾讯混元发布原生 3D 组件生成模型，让机器人“先思考再行动”，加速通用机器人和自动化落地。

具身智能机器人 VLA 零样本 3D生成

2025-09-22

AI视频/3D生成进入落地爆发期

阿里开源Wan-Animate一张图生成动画并支持人物替换，YouTube发布AI视频生成与面部保护工具，Tripo等平台推动3.0原生工作流，标志生成式AI正从“能生成”走向“可生产”，大幅降低影视、游戏、设计行业的内容制作成本。

AI视频生成 3D生成 Wan-Animate YouTube 内容创作

2025-08-20

超长视频与3D游戏生成突破

LongVie框架在生成长达分钟级连贯视频上刷新SOTA，解决镜头一致性与故事线难题；CombatVLA推出首个3D动作游戏专用VLA模型，在《黑神话》《只狼》中击败人类玩家。生成式AI从“看得懂”走向“玩得动”，打开影视、游戏UGC及互动内容新蓝海。

LongVie CombatVLA 视频生成游戏AI 3D生成

2025-08-17

3D生成与评估标准化

上海AI Lab联合复旦、清华推出层次化3D生成质量榜单，终结“Demo吸睛”式主观评测；2025年模型能力跃升但缺乏统一度量，行业急需可复现、可拆分的评估体系以支撑内容工业落地。

3D生成评估标准内容工业质量榜单可复现性

2025-08-16

机器人产业链集结

FAIR plus 2026发布会与多档标准评测亮相，3D生成质量榜单、提示词多样性技巧、宇树机器人“撞人逃逸”事件等，显示硬件-算法-场景全链条正加速标准化与商业化。

机器人 3D生成评测标准产业链 FAIR plus

2025-08-13

国产大模型技术突围

华人团队用扩散模型将上下文潜力提升3倍，商汤发布国内首个“图文交错”多模态大模型日日新6.5，腾讯混元3D、52B视觉模型及阿里Qwen Code相继开源或免费，显示国产模型在3D生成、代码、多模态等细分赛道加速追赶并局部领先。

扩散模型国产大模型多模态开源 3D生成

2025-08-11

多模态生成与3D/视频模型爆发

谷歌Genie 3、阿里Wan2.1-I2V-Flash、虚拟试穿Voost、图生视频SkyReels-A3等密集发布，实现秒级交互式3D世界、高保真纹理还原及语音对口型，显示多模态生成正从“可用”走向“好用”，重塑电商、影视、UGC内容生产链。

多模态 3D生成视频模型虚拟试穿 Genie3

2025-08-03

3D生成与效率优化

Ultra3D框架实现“一键精细到毛发”的3D资产生成，腾讯混元开源MixGRPO将训练时间减半而性能提升，显示AIGC在高质量内容与训练效率两端同步突破，加速影视、游戏落地。

3D生成 Ultra3D MixGRPO 训练效率 AIGC

# 3D生成

具身智能与物理AI突破

AI内容创作与3D生成

3D与多模态生成突破

世界模型开源潮

AI视频/3D创作平民化

多模态大模型竞速

多模态大模型突破

谷歌Gemini 3高价争议

视频/3D 生成进入实时时代

世界模型3D生成大众化

空间智能与世界模型商用化

多模态大模型竞速

机器人具身智能突破

AI视频/3D生成进入落地爆发期

超长视频与3D游戏生成突破

3D生成与评估标准化

机器人产业链集结

国产大模型技术突围

多模态生成与3D/视频模型爆发

3D生成与效率优化