加载头像
大模型评估

2024

K-Sort Arena:视觉生成模型的高效人类偏好竞技场
K-Sort Arena:视觉生成模型的高效人类偏好竞技场
MixEval:混合评测数据集来拟合大语言模型的人类评估
MixEval:混合评测数据集来拟合大语言模型的人类评估
引用到评论
随便逛逛博客分类文章标签
复制地址关闭热评深色模式轉為繁體