Hedra - AI话题 - AI快开门

2025-03-10

多模态与数字人创新

Hedra Character-3、Heygem、谷歌Gemini Embedding等新品实现图文音联合推理、高保真数字人克隆与最强文本嵌入，多模态能力再上新台阶，为内容产业提供新引擎。

多模态数字人 Gemini Embedding Hedra Heygem

2024-06-21

视频/多模态生成再突破

斯坦福 Hedra、快手可灵、Luma、Runway 等工具将文生视频时长推至 30 秒-3 分钟，支持音频驱动、4D 重建与多模态混剪；CVPR 最佳学生论文 BioCLIP 与智源 3D 医学多模态大模型进一步拓展视觉基础模型边界，显示多模态仍是研发焦点。

文生视频 Hedra 可灵多模态 BioCLIP

2024-06-19

视频生成大模型爆发

Runway Gen-3、Luma、潞晨Open-Sora、Hedra Character-1等国内外模型密集发布，支持16秒720p高清、角色一致、唱歌说话等能力，标志AI视频进入可用阶段，影视、广告、UGC内容生产链将被重塑。

视频生成 Runway Open-Sora Hedra Gen-3