AI快开门

发现最好的AI工具

2025-09-08

多模态创作工具爆发

字节Seedream 4.0、即梦图片4.0、PixVerse V5、Snapchat AI滤镜等密集上线,文生图、图生视频、语音合成一站式打通,创作者门槛骤降,内容生态迎来AI原生爆款潮。
2025-05-15

视频生成军备升级

淘宝天猫上线AI图生视频、可灵2.0继续霸榜、Lightricks推出10秒级LTX-Video-13B,Poe报告显示国产可灵已占30%份额,视频生成进入“秒级高清+电商落地”双轨竞速,中美模型差距快速缩小。
2025-03-07

多模态文档与视频理解突破

Mistral OCR API号称全球最强,千页7元即可解析;腾讯混元开源图生视频模型,Runway上线首帧风格迁移;智源BGE-VL、IDEA DINO-XSeek在图文检索、自然语言目标检测刷新SOTA,多模态能力正从“看得清”走向“看得懂”。
2025-03-06

多模态大模型技术突破

Cohere发布Aya Vision 8B/32B、智源开源BGE-VL多模态向量模型,谷歌推出Whisk Animate图生8秒视频,腾讯混元图生视频全面开源,显示多模态理解与生成在视觉、语音、视频多域同步跃进,为内容创作、搜索、机器人提供新基座。
2024-11-07

生成式AI模型爆发

Stable Diffusion 3.5、FLUX 1.1 Pro Ultra、字节X-Portrait 2等新一代文生图、图生视频模型密集发布,在4兆像素超清、10秒级生成、单图驱动动画等维度刷新SOTA,标志AIGC进入高分辨率、低成本、多模态并行时代,将重塑设计、影视、电商内容管线。
2024-06-11

国产视频生成模型爆发

腾讯混元、北大-快手、生数科技等接连发布Follow-Your-Pose-v2、VideoTetris及中国版Sora,支持多人运动、长镜头与复杂指令,刷新图生视频、文生视频时长与一致性指标,显示国内在扩散模型工程化与数据引擎侧的快速追赶。