AI快开门

发现最好的AI工具

2024-09-17

多模态基准与模型升级

MMMU-Pro将多模态评测推向“史诗级难度”,过滤纯文本、新增纯视觉问答;OPPO AndesGPT-2.0同步升级多模态能力,显示终端厂商与学术团队正把多模态理解作为下一代AI核心战场。
2024-04-06

AI训练数据与评测新发现

“弱智吧”语料被中科院等验证为最佳中文训练数据,8项评测第一;中科大发现大模型无需看图即可答视觉题,提示数据与评测方法仍存巨大优化空间。数据质量与评测公平性成为模型性能提升的关键变量。