AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
MegaSaM
相关话题
2024-12-25
多模态视觉推理模型爆发
阿里开源 QVQ-72B、谷歌 DeepMind 推 MegaSaM,实现视觉问答、3D 景深与相机视角估计;QQ 音乐 14.0 上线首个 AI 大模型音效,多模态能力从科研走向消费级应用,降低内容创作门槛。
多模态
QVQ-72B
MegaSaM
视觉推理
AI音效