加载头像
LLM

2025

COAT:显存高效的 FP8 训练,实现高效深度学习
COAT:显存高效的 FP8 训练,实现高效深度学习
PC-Agent:面向复杂 PL 任务的多模态智能体框架
PC-Agent:面向复杂 PL 任务的多模态智能体框架
基于 LightLLM 的 DeepSeek R1/V3 模型部署实战
基于 LightLLM 的 DeepSeek R1/V3 模型部署实战
PRIME:结合隐式过程奖励的强化学习
PRIME:结合隐式过程奖励的强化学习
Satori:通过训练LLM做自回归搜索来增强推理能力
Satori:通过训练LLM做自回归搜索来增强推理能力

2024

XGrammar:高效实现 LLM灵活且可移植的结构化生成
XGrammar:高效实现 LLM灵活且可移植的结构化生成
LLMC:大语言模型压缩工具的开发实践
LLMC:大语言模型压缩工具的开发实践
DuQuant: 基于正交变换实现大型语言模型的 SOTA级 4 bit 量化
DuQuant: 基于正交变换实现大型语言模型的 SOTA级 4 bit 量化
LLMC:大语言模型的量化基准
LLMC:大语言模型的量化基准
mPLUG-Owl3:探索长序列模型架构的通用多模态大模型
mPLUG-Owl3:探索长序列模型架构的通用多模态大模型
SGLang v0.2:面向 LLM 和 VLM 的快速、高效通用服务引擎
SGLang v0.2:面向 LLM 和 VLM 的快速、高效通用服务引擎
S-LoRA:实现多 LoRA 大模型的高效并行化推理
S-LoRA:实现多 LoRA 大模型的高效并行化推理
AWQ:激活值感知的LLM低位权重量化
AWQ:激活值感知的LLM低位权重量化
SEED-Story:生成长篇图文故事的多模态大型语言模型
SEED-Story:生成长篇图文故事的多模态大型语言模型
YOLO-World:基于视觉语言模型的实时开放词汇物体检测
YOLO-World:基于视觉语言模型的实时开放词汇物体检测
MiniCPM-V:端侧可用的GPT-4V级多模态大模型
MiniCPM-V:端侧可用的GPT-4V级多模态大模型
LLaMA Factory:从预训练到RLHF,大模型高效训练框架
LLaMA Factory:从预训练到RLHF,大模型高效训练框架
VillagerAgent:减少幻觉、提高任务分解效率的多智能协作体框架
VillagerAgent:减少幻觉、提高任务分解效率的多智能协作体框架
LLaMA Pro:扩展Transformer块优化的大型语言模型继续预训练
LLaMA Pro:扩展Transformer块优化的大型语言模型继续预训练
PiSSA:收敛快、误差小的大模型参数高效微调方法
PiSSA:收敛快、误差小的大模型参数高效微调方法
MixEval:混合评测数据集来拟合大语言模型的人类评估
MixEval:混合评测数据集来拟合大语言模型的人类评估
Mini-Gemini:挖掘多模态视觉语言大模型的潜力
Mini-Gemini:挖掘多模态视觉语言大模型的潜力
从 3D LLM 到 MultiPLY ,3D 具身基础模型的构建
从 3D LLM 到 MultiPLY ,3D 具身基础模型的构建
ChatDev:大语言模型驱动的多智能体协作与演化
ChatDev:大语言模型驱动的多智能体协作与演化
引用到评论
随便逛逛博客分类文章标签
复制地址关闭热评深色模式轉為繁體