AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
CharXiv
相关话题
2024-06-29
多模态评测新基准密集上线
陈丹琦团队发布CharXiv图表推理集,真实arXiv图表2323张让Claude3.5仅及格;Resemble AI推出Detect-2B深度伪造检测模型,准确率94%;Video-MME同时上线。新基准聚焦图表、视频、语音伪造等细粒度能力,填补传统NLP评测空白,倒逼模型厂商提升多模态安全与可靠性。
评测基准
多模态
深度伪造
图表推理
CharXiv