DINO - AI话题 - AI快开门

2025-08-16

多模态大模型争霸

Meta开源70亿参数DINOv3、GPT-5医学多模态刷新SOTA，开源与闭源齐头并进，视觉-语言-语音一体化成为头部厂商必争之地，将加速自动驾驶、医疗影像、内容生成等场景落地。

多模态 DINOv3 GPT-5 医疗影像开源

2025-08-15

视觉大模型开源竞速

Meta开源DINOv3，自监督性能首次全面超越弱监督，成为视觉新基座；Midjourney升级全民高清视频生成，国内字节DreamVVT商用换装，多模态视觉进入“开源+消费级”双轨爆发。

视觉模型开源 DINOv3 视频生成多模态

2025-03-09

模型架构与视觉基础模型创新

英伟达提出Mamba-Transformer混合视觉骨干MambaVision，在精度与吞吐双破SOTA；港大&伯克利发布SimDINO系列，用编码率正则化简化DINO训练，为视觉-语言模型提供更高效编码器。

MambaVision 视觉骨干 SimDINO DINO 编码率正则化