AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
视觉定位
相关话题
2026-01-02
多模态安全与评测
港科大联合牛津等发布首个音频越狱基准Jailbreak-AudioBench,揭示语调、语速即可攻破大音频模型;VGent架构在视觉定位任务F1暴涨20分并保持恒定推理速度。多模态能力扩张同时,安全与评测体系同步升级。
多模态安全
音频越狱
视觉定位
评测基准
鲁棒性
2025-04-08
多模态大模型技术突破潮
Vision-R1、SkyReels-A2、Sync Labs Lipsync-2 等新框架在视觉定位、可控视频生成、零样本嘴型同步等方向刷新 SOTA;谷歌、Runway、亚马逊亦升级多模态模型,显示生成式 AI 正向更细粒度、跨模态对齐与实时交互快速演进。
多模态
视频生成
视觉定位
零样本