AI快开门
发现最好的AI工具
首页
分类
模型
模型历史
模型排名
模型价格
话题
简报
搜索
← 返回话题列表
#
SWEBench
相关话题
2024-06-04
多模态与代码生成新纪录
多模态模型在扑克牌复杂博弈中超越GPT-4V,展示强化学习新框架威力;StarShip CodeGen Agent以23.67%成绩创非GPT-4o基模最佳纪录,预示多模态与自动编程能力同步跃升。
多模态模型
代码生成
StarShip
扑克博弈
SWEBench