2025-09-08
多模态创作工具爆发
字节Seedream 4.0、即梦图片4.0、PixVerse V5、Snapchat AI滤镜等密集上线,文生图、图生视频、语音合成一站式打通,创作者门槛骤降,内容生态迎来AI原生爆款潮。
2025-05-15
视频生成军备升级
淘宝天猫上线AI图生视频、可灵2.0继续霸榜、Lightricks推出10秒级LTX-Video-13B,Poe报告显示国产可灵已占30%份额,视频生成进入“秒级高清+电商落地”双轨竞速,中美模型差距快速缩小。
2025-03-07
多模态文档与视频理解突破
Mistral OCR API号称全球最强,千页7元即可解析;腾讯混元开源图生视频模型,Runway上线首帧风格迁移;智源BGE-VL、IDEA DINO-XSeek在图文检索、自然语言目标检测刷新SOTA,多模态能力正从“看得清”走向“看得懂”。
2025-03-06
多模态大模型技术突破
Cohere发布Aya Vision 8B/32B、智源开源BGE-VL多模态向量模型,谷歌推出Whisk Animate图生8秒视频,腾讯混元图生视频全面开源,显示多模态理解与生成在视觉、语音、视频多域同步跃进,为内容创作、搜索、机器人提供新基座。
2024-11-07
生成式AI模型爆发
Stable Diffusion 3.5、FLUX 1.1 Pro Ultra、字节X-Portrait 2等新一代文生图、图生视频模型密集发布,在4兆像素超清、10秒级生成、单图驱动动画等维度刷新SOTA,标志AIGC进入高分辨率、低成本、多模态并行时代,将重塑设计、影视、电商内容管线。
2024-06-11
国产视频生成模型爆发
腾讯混元、北大-快手、生数科技等接连发布Follow-Your-Pose-v2、VideoTetris及中国版Sora,支持多人运动、长镜头与复杂指令,刷新图生视频、文生视频时长与一致性指标,显示国内在扩散模型工程化与数据引擎侧的快速追赶。