从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化
发表于🎥 观看直播

从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化
青稞4月22日上午9点,青稞Talk 第46期,UC Berkeley 博士生、TinyZero项目作者潘家怡和APR合作者李岫宇,将直播分享《从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化》。
潘家怡,UC Berkeley 博士生,导师为 Alane Suhr教授,此前本科毕业于上海交通大学和密西根大学。现主要研究方向为大语言模型后训练方向,通过强化学习等方式提高模型在Agent和Reasoning上的能力。个人主页:jiayipan.com
主题提纲
从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化
- 1、TinyZero: 低成本复现 DeepSeek R1 Zero Aha moment
- 2、大语言模型传统 CoT 推理中的挑战
- 3、APR: 自适应并行推理框架介绍
- 4、端到端强化学习驱动优化
直播时间
4月22日上午9:00 - 10:00
参与方式
Talk 将在青稞·知识社区上进行,扫码对暗号:" 0422
",报名进群!