加载头像
图片
2025-03-22COAT:显存高效的 FP8 训练,实现高效深度学习
3月22日上午11点 ,青稞Talk 第42期,COAT 第一作者、加州大学伯克利分校计算机科学博士生席浩诚,将直播分享《COAT:显存高效的 FP8 训练,实现高效深度学习》。 分享嘉宾 席浩诚是加州大学伯克利分校计算机科学博士一年级学生,导师是Kurt Keutzer教授,研究方向为大型语言模型和扩散模型的高效训练与推理。本科毕业于清华大学姚班,师从陈键飞教授和朱军教授。他曾在英伟达实习研究FP8训练方法。他曾在ICMl、Neurips、ICLR等顶级会议上发表多篇论文,他的主要研究成果包括Sparse VideoGen、COAT、Jetfire等。 主题提纲 COAT:显存高效的 FP8 训练,实现高效深度学习 1、大模型 FP8 低精度训练的难点 2、COAT 框架两大核心技术 - 动态范围扩展 FP8 量化优化器状态 - 混合粒度 FP8 精度流 3、效果展示及应用实践 直播时间 3月8日(周六) 11:00 -12:00 成果链接 论文标题:COAT: Compressing Optimizer States and Activation for memory effi ...
详情
图片
2025-02-15Satori:通过训练LLM做自回归搜索来增强推理能力
2月15日上午11点,青稞Talk 第38期,Satori第一作者、MIT博士生沈茂昊,将直播分享《Satori:通过训练LLM做自回归搜索来增强推理能力》。 主讲嘉宾 沈茂昊,MIT EECS系四年级博士生,长期和MIT-IBM Watson AI lab 合作,本科毕业于UIUC ECE系。研究兴趣包括提升AI系统的可靠性,不确定性估计,以及涉及LLM的多个方向,包括提升LLM的推理能力等,曾在ICML、NeurIPS、AAAI等AI学术会议发表多篇论文。 主题提纲 Satori:通过训练LLM做自回归搜索来增强推理能力 1、O1 类推理模型的技术路线 2、Satori 推理模型及两阶段训练解析 - 行动思维链 COAT 推理范式 - 小规模格式微调 - 大规模的强化学习阶段 3、Satori 的推理能力及泛化讨论 成果链接 Paper:https://arxiv.org/pdf/2502.02508 Project:https://satori-reasoning.github.io 直播时间 2月15日(周六)11:00 – 12:00
详情
图片
2024-10-17GenAD & Vista:构建通用可泛化的自动驾驶世界模型
10月17日19点,青稞Talk 第27期,香港科技大学在读博士高深远,将直播分享《GenAD & Vista:构建通用可泛化的自动驾驶世界模型》。 主讲嘉宾 高深远,香港科技大学在读博士,研究兴趣主要围绕具身场景中世界模型的构建及应用。曾在CVPR、NeurIPS、ECCV以第一作者身份发表多篇论文,并担任TPAMI、ICLR、NeurIPS、CVPR等期刊会议的审稿人。 主题提纲 GenAD & Vista:构建通用可泛化的自动驾驶世界模型 1、世界模型的概念及其重要性 2、GenAD和OpenDV大规模自动驾驶数据集 3、Vista:高保真且多样可控的通用自动驾驶世界模型 4、应用分析及未来研究探讨 成果链接 Paper:Vista: A Generalizable Driving World Model with High Fidelity and Versatile Controllability Abs:https://arxiv.org/abs/2405.17398 Code:https://github.com/opendrivelab/vista ...
详情
图片
2024-07-08LLaMA Factory:从预训练到RLHF,大模型高效训练框架
7月8日晚7点,青稞Talk第13期,北京航空航天大学博士生郑耀威,将直播分享《LLaMA Factory:从预训练到RLHF,大模型高效训练框架》。 分享嘉宾 郑耀威,北京航空航天大学博士生。以第一作者在ACL、CVPR、AAAI、WWW等国际会议发表多篇论文,担任AAAI、EMNLP、Neural Computation等会议和期刊审稿人。曾获得华为杯数学建模全国一等奖、蓝桥杯全国一等奖、北航榜样、北航博士新生奖学金。大模型训练框架LLaMA Factory作者,GitHub开源项目获得超过2万Stars,受邀至人工智能计算大会、阿里云AI智领者峰会、中国人民大学、智谱AI作大模型主题报告。 主题提纲 LLaMA Factory:从预训练到RLHF,大模型高效训练框架 1、大模型高效训练现状 2、LLaMA Factory 的构建动机与组成模块 - 上百种大模型的全栈微调适配原理 - LoRA算子优化加速方法 - 多种微调Trick集成思路 3、LLaMA Factory 部署实践 成果链接 Abs:http://arxiv.org/abs/2403.13372 Code:ht ...
详情
VideoGrain:基于扩散模型的多粒度视频编辑的探索与应用
COAT:显存高效的 FP8 训练,实现高效深度学习
PC-Agent:面向复杂 PL 任务的多模态智能体框架
基于 LightLLM 的 DeepSeek R1/V3 模型部署实战
PRIME:结合隐式过程奖励的强化学习
Satori:通过训练LLM做自回归搜索来增强推理能力
Motion Dreamer:面向自动驾驶与物理世界对齐的视频生成模型
Follow Family:可控视频生成方法探索与应用
Tuning-Free Enhence:通过噪声初始化和采样轨迹优化增强预训练扩散模型
K-Sort Arena:视觉生成模型的高效人类偏好竞技场
XGrammar:高效实现 LLM灵活且可移植的结构化生成
LLMC:大语言模型压缩工具的开发实践
Rectified Flow:矫正流生成式模型的概念及应用实践
OminiParser:基于纯视觉的 GUI Agent
VILA^2:视觉语言模型能力的自我提升
DuQuant: 基于正交变换实现大型语言模型的 SOTA级 4 bit 量化
GenAD & Vista:构建通用可泛化的自动驾驶世界模型
SGLang、FlashInfer和MLC LLM:大模型高效部署与服务
VITA:开源交互式多模态基础大模型
LLMC:大语言模型的量化基准
使用CAMEL Agents构建GraphRAG及应用实践
CogVideoX 视频生成开源模型上手实践
SGLang v0.3发布!SGLang邀请您参与开发者会议
mPLUG-Owl3:探索长序列模型架构的通用多模态大模型
SGLang v0.2:面向 LLM 和 VLM 的快速、高效通用服务引擎
S-LoRA:实现多 LoRA 大模型的高效并行化推理
AWQ:激活值感知的LLM低位权重量化
InternVL 2.0:通过渐进式策略扩展开源多模态大模型的性能边界
SEED-Story:生成长篇图文故事的多模态大型语言模型
YOLO-World:基于视觉语言模型的实时开放词汇物体检测
MiniCPM-V:端侧可用的GPT-4V级多模态大模型
Mobile-Agent:基于多模态Agent架构的手机智能体
LLaMA Factory:从预训练到RLHF,大模型高效训练框架
VillagerAgent:减少幻觉、提高任务分解效率的多智能协作体框架
LLaMA Pro:扩展Transformer块优化的大型语言模型继续预训练
PiSSA:收敛快、误差小的大模型参数高效微调方法
具身多模态大模型的视觉表征预训练研究
VideoBooth:文本和图像提示共同驱动的视频生成
MixEval:混合评测数据集来拟合大语言模型的人类评估
实时渲染 3DGS 中的反走样及逆渲染应用
3D-VLA:构建生成式三维具身世界模型
Mini-Gemini:挖掘多模态视觉语言大模型的潜力
从 3D LLM 到 MultiPLY ,3D 具身基础模型的构建
ChatDev:大语言模型驱动的多智能体协作与演化
SceneTex:高质量三维室内场景纹理图生成
青稞Panel 01 | Sora迷思:AIGC的微积分时刻?
引用到评论
随便逛逛博客分类文章标签
复制地址关闭热评深色模式轉為繁體