verl 源码解读 与 HybridFlow 编程范式讲解
发表于🎥 观看直播

verl 源码解读 与 HybridFlow 编程范式讲解
青稞5月19晚8点,verl core contributor 童雨轩,将直播分享《verl 源码解读 与 HybridFlow 编程范式讲解》。
本次 Talk 会从entrypoint(例如 main_ppo.py)入手,按程序执行顺序讲解 verl 的主要逻辑(类似 debugger 视角,但经过整理总结),穿插介绍 HybridFlow 编程范式的主要内容与设计动机。希望能让大家获得对 verl 的行为与设计思想较为全面的理解。
分享嘉宾
童雨轩,清华大学计算机系本科生,曾于清华大学知识工程实验(THUKEG)、香港科技大学自然语言处理实验室(HKUST-NLP)、卡耐基梅隆大学语言技术研究所(CMU-LTI)、字节跳动 Seed 等机构实习。在 NeurIPS、ICLR、ICML 等国际会议发表论文 3 篇,谷歌学术引用量达 650。研究兴趣集中在自然语言处理、机器学习、强化学习等领域,致力于构建具备长上下文推理能力的人工智能系统。
主题提纲
verl 源码解读 与 HybridFlow 编程范式讲解
1、Debugger 视角源码讲解:verl 执行逻辑 2、HybridFlow 编程范式的主要内容与设计动机 3、verl Programming Guide
直播时间
5月19日20:00 - 21:00