AI快开门

发现最好的AI工具

2024-12-25

多模态视觉推理模型爆发

阿里开源 QVQ-72B、谷歌 DeepMind 推 MegaSaM,实现视觉问答、3D 景深与相机视角估计;QQ 音乐 14.0 上线首个 AI 大模型音效,多模态能力从科研走向消费级应用,降低内容创作门槛。