LLaMA Factory：从预训练到RLHF，大模型高效训练框架

青稞2024-07-08

7月8日晚7点，青稞Talk第13期，北京航空航天大学博士生郑耀威，将直播分享《LLaMA Factory：从预训练到RLHF，大模型高效训练框架》。

分享嘉宾

郑耀威，北京航空航天大学博士生。以第一作者在ACL、CVPR、AAAI、WWW等国际会议发表多篇论文，担任AAAI、EMNLP、Neural Computation等会议和期刊审稿人。曾获得华为杯数学建模全国一等奖、蓝桥杯全国一等奖、北航榜样、北航博士新生奖学金。大模型训练框架LLaMA Factory作者，GitHub开源项目获得超过2万Stars，受邀至人工智能计算大会、阿里云AI智领者峰会、中国人民大学、智谱AI作大模型主题报告。

主题提纲

LLaMA Factory：从预训练到RLHF，大模型高效训练框架

1、大模型高效训练现状
2、LLaMA Factory 的构建动机与组成模块
- 上百种大模型的全栈微调适配原理
- LoRA算子优化加速方法
- 多种微调Trick集成思路
3、LLaMA Factory 部署实践

成果链接

Abs：http://arxiv.org/abs/2403.13372
Code：https://github.com/hiyouga/LLaMA-Factory

直播时间

7月8日（周一）19:00 - 20:00