AI快开门

发现最好的AI工具

2024-07-17

大模型基础能力短板暴露

多家主流大模型在简单数字比较、视觉基础测试中出现集体翻车,暴露当前LLM与VLM在符号推理、细粒度视觉理解等基础能力上的共性缺陷,引发行业对模型评估与安全边界的重新审视。