加载头像
大模型微调
2024
DPO新作Your Language Model is Secretly a Q-Function解读,与OPENAI Q* 的联系?
DPO新作Your Language Model is Secretly a Q-Function解读,与OPENAI Q* 的联系?1
DPO,RM,RLHF 傻傻分不清楚
DPO,RM,RLHF 傻傻分不清楚2
引用到评论
随便逛逛博客分类文章标签
复制地址关闭热评深色模式轉為繁體