AI快开门

发现最好的AI工具

2024-05-29

顶级模型评测与认知框架

CoT提出者Jason Wei指出当前大模型基准存在「七宗罪」,难以全面评估能力;复旦&上海AI Lab上线3DGen-Arena,用众包方式360°评测3D生成;哈工大与度小满提出SAPT共享注意力框架,提升持续学习性能。行业开始反思评估体系本身,推动更科学的测试基准,将决定下一代模型的优化方向与竞争格局。