加载头像
LLM
2025
以RLer视角看大模型训练中的强化学习
以RLer视角看大模型训练中的强化学习1
DeepSeek-V3/R1 的 Hosting 成本预估
DeepSeek-V3/R1 的 Hosting 成本预估2
Deepseek R1 Zero 复现, 三阶段RL!
Deepseek R1 Zero 复现, 三阶段RL!3
MiniMax-01技术报告解读
MiniMax-01技术报告解读4
从DeepSeek MTP,解析MTP技术的前世今生
从DeepSeek MTP,解析MTP技术的前世今生5
计算DeepSeekV3训练的MFU
计算DeepSeekV3训练的MFU6
2024
一位大佬的自述 | 从读博到 Google DeepMind,旅程中的心得与感恩
一位大佬的自述 | 从读博到 Google DeepMind,旅程中的心得与感恩7
ICLR 8分论文:模型自身也可以标注偏好数据
ICLR 8分论文:模型自身也可以标注偏好数据8
OpenAI o1复现之旅:通过简单蒸馏是超越o1-preview的巨大进步还是苦涩教训?
OpenAI o1复现之旅:通过简单蒸馏是超越o1-preview的巨大进步还是苦涩教训?9
干货!大模型 LLM 训练基础知识
干货!大模型 LLM 训练基础知识10
引用到评论
随便逛逛博客分类文章标签
复制地址关闭热评深色模式轉為繁體