AI快开门

发现最好的AI工具

2024-06-29

多模态评测新基准密集上线

陈丹琦团队发布CharXiv图表推理集,真实arXiv图表2323张让Claude3.5仅及格;Resemble AI推出Detect-2B深度伪造检测模型,准确率94%;Video-MME同时上线。新基准聚焦图表、视频、语音伪造等细粒度能力,填补传统NLP评测空白,倒逼模型厂商提升多模态安全与可靠性。