AI快开门

发现最好的AI工具

2025-08-16

多模态大模型争霸

Meta开源70亿参数DINOv3、GPT-5医学多模态刷新SOTA,开源与闭源齐头并进,视觉-语言-语音一体化成为头部厂商必争之地,将加速自动驾驶、医疗影像、内容生成等场景落地。
2025-08-15

视觉大模型开源竞速

Meta开源DINOv3,自监督性能首次全面超越弱监督,成为视觉新基座;Midjourney升级全民高清视频生成,国内字节DreamVVT商用换装,多模态视觉进入“开源+消费级”双轨爆发。
2025-03-09

模型架构与视觉基础模型创新

英伟达提出Mamba-Transformer混合视觉骨干MambaVision,在精度与吞吐双破SOTA;港大&伯克利发布SimDINO系列,用编码率正则化简化DINO训练,为视觉-语言模型提供更高效编码器。