AI快开门

发现最好的AI工具

2025-03-10

多模态与数字人创新

Hedra Character-3、Heygem、谷歌Gemini Embedding等新品实现图文音联合推理、高保真数字人克隆与最强文本嵌入,多模态能力再上新台阶,为内容产业提供新引擎。
2024-06-21

视频/多模态生成再突破

斯坦福 Hedra、快手可灵、Luma、Runway 等工具将文生视频时长推至 30 秒-3 分钟,支持音频驱动、4D 重建与多模态混剪;CVPR 最佳学生论文 BioCLIP 与智源 3D 医学多模态大模型进一步拓展视觉基础模型边界,显示多模态仍是研发焦点。
2024-06-19

视频生成大模型爆发

Runway Gen-3、Luma、潞晨Open-Sora、Hedra Character-1等国内外模型密集发布,支持16秒720p高清、角色一致、唱歌说话等能力,标志AI视频进入可用阶段,影视、广告、UGC内容生产链将被重塑。