AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
指令跟随
相关话题
2024-11-22
AI安全与评估体系
国产模型在LiveBench指令跟随榜跃居全球第五、中文SimpleQA真实性基准发布、RAG四级难度分类法出炉,显示行业正构建更细粒度、更难“作弊”的评测体系,为模型落地提供可信度量尺。
模型评估
中文基准
指令跟随
RAG
安全性