AI快开门

发现最好的AI工具

2025-08-30

多模态创意工具爆发

谷歌nano-banana凭“多图融合+2D转3D+记忆创作”席卷社媒,手办图刷屏小红书;腾讯混元开源HunyuanVideo-Foley,一键生成电影级音效,音画同步达SOTA。图像、音效、视频的多模态生成正从“可用”跃升为“可玩”,降低UGC创作门槛,预示内容生态迎来AI原生浪潮。
2024-12-25

多模态视觉推理模型爆发

阿里开源 QVQ-72B、谷歌 DeepMind 推 MegaSaM,实现视觉问答、3D 景深与相机视角估计;QQ 音乐 14.0 上线首个 AI 大模型音效,多模态能力从科研走向消费级应用,降低内容创作门槛。