AI快开门

发现最好的AI工具

2024-07-19

多模态长视频理解突破

Goldfish 模型实现任意长度长视频精准理解,VoCoT 引入视觉思维链多步推理,谷歌 Gemini 将贯穿巴黎奥运直播,显示多模态大模型正向长时序、复杂事件与实时转播场景延伸,打开体育、娱乐、教育等全新交互体验。