2025-03-10
多模态与数字人创新
Hedra Character-3、Heygem、谷歌Gemini Embedding等新品实现图文音联合推理、高保真数字人克隆与最强文本嵌入,多模态能力再上新台阶,为内容产业提供新引擎。
2024-06-21
视频/多模态生成再突破
斯坦福 Hedra、快手可灵、Luma、Runway 等工具将文生视频时长推至 30 秒-3 分钟,支持音频驱动、4D 重建与多模态混剪;CVPR 最佳学生论文 BioCLIP 与智源 3D 医学多模态大模型进一步拓展视觉基础模型边界,显示多模态仍是研发焦点。