CharXiv - AI话题 - AI快开门

2024-06-29

多模态评测新基准密集上线

陈丹琦团队发布CharXiv图表推理集，真实arXiv图表2323张让Claude3.5仅及格；Resemble AI推出Detect-2B深度伪造检测模型，准确率94%；Video-MME同时上线。新基准聚焦图表、视频、语音伪造等细粒度能力，填补传统NLP评测空白，倒逼模型厂商提升多模态安全与可靠性。

评测基准多模态深度伪造图表推理 CharXiv

# CharXiv

多模态评测新基准密集上线