从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化

4月22日上午9点,青稞Talk 第46期,UC Berkeley 博士生、TinyZero项目作者潘家怡和APR合作者李岫宇,将直播分享《从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化》。

潘家怡,UC Berkeley 博士生,导师为 Alane Suhr教授,此前本科毕业于上海交通大学和密西根大学。现主要研究方向为大语言模型后训练方向,通过强化学习等方式提高模型在Agent和Reasoning上的能力。个人主页:jiayipan.com

主题提纲

从 TinyZero 到 APR:语言模型推理能力的探索与自适应并行化

  • 1、TinyZero: 低成本复现 DeepSeek R1 Zero Aha moment
  • 2、大语言模型传统 CoT 推理中的挑战
  • 3、APR: 自适应并行推理框架介绍
  • 4、端到端强化学习驱动优化

直播时间

4月22日上午9:00 - 10:00

参与方式

Talk 将在青稞·知识社区上进行,扫码对暗号:" 0422 ",报名进群!