2026-01-15
多模态生成进入4K竖屏时代
谷歌Veo 3.1原生支持竖屏4K,苹果Manzano打通“看懂+绘制”,国产PixVerse P1迈向通用级,视频、图像、语音一体化生成质量跃升,短视频、广告、教育等内容产业迎来零门槛AIGC。
2025-09-29
谷歌 Veo 3 视觉生成里程碑
谷歌 Veo 3 被官方称为视觉领域“GPT-3 时刻”,可实时生成界面、自动解迷宫、玩数独,提出视频“帧链”思维链机制,显示多模态生成从“看得像”走向“想得通”,将加速自动驾驶、机器人及交互式媒体落地。
2025-07-10
AI视频生成全面落地
谷歌Veo 3升级“照片转视频”并开放150国付费使用,7周生成4,000万条短片;阿里开源ThinkSound自动为视频配音效;爱诗PixVerse入选联合国AI for Good案例。生成式视频正从Demo走向广告、动漫、UGC等商用场景,内容生产成本骤降,创意产业面临供应链重塑。
2025-05-22
多模态大模型爆发
谷歌Veo 3、字节BAGEL、MMaDA等密集发布,实现视频/图像/文本统一生成,音画同步、一步成片的“默剧终结者”出现,标志生成式AI进入多模态实时创作新阶段,影视、广告、UGC内容生产范式将被重写。
2025-05-21
谷歌I/O全家桶升级
Google I/O 2025一次性发布Gemini 2.5 Pro/Flash、Veo 3、Imagen 4、Project Astra/Mariner等20+新品,覆盖视频生成、多模态推理、AI搜索、虚拟试衣、3D通话全场景,确立目前最完整的大模型产品矩阵,并推出249美元/月的AI Ultra订阅,将顶级生成式能力直接商业化。