标签: LLM | 青稞社区

#LLM 25 #AIGC 10 #多模态大模型 10 #视频生成 7 #AI Agent 7 #大模型推理 6 #大模型训练 5 #推理大模型 4 #具身智能 4 #大模型量化 4 #3D生成 3 #SGLang 3 #强化学习 2 #AI Infra 2 #世界模型 2 #大模型评估 2 #VLM 2 #视频编辑 1 #大模型 1 #3DGS 1 #大模型微调 1 #RAG 1 #自动驾驶 1

LLM

2025

从 TinyZero 到 APR：语言模型推理能力的探索与自适应并行化

从 TinyZero 到 APR：语言模型推理能力的探索与自适应并行化

2025-04-22

COAT：显存高效的 FP8 训练，实现高效深度学习

COAT：显存高效的 FP8 训练，实现高效深度学习

2025-03-22

PC-Agent：面向复杂 PL 任务的多模态智能体框架

PC-Agent：面向复杂 PL 任务的多模态智能体框架

2025-03-15

基于 LightLLM 的 DeepSeek R1/V3 模型部署实战

基于 LightLLM 的 DeepSeek R1/V3 模型部署实战

2025-03-08

PRIME：结合隐式过程奖励的强化学习

PRIME：结合隐式过程奖励的强化学习

2025-02-22

Satori：通过训练LLM做自回归搜索来增强推理能力

Satori：通过训练LLM做自回归搜索来增强推理能力

2025-02-15

2024

XGrammar：高效实现 LLM灵活且可移植的结构化生成

XGrammar：高效实现 LLM灵活且可移植的结构化生成

2024-12-21

LLMC：大语言模型压缩工具的开发实践

LLMC：大语言模型压缩工具的开发实践

2024-12-16

DuQuant：基于正交变换实现大型语言模型的 SOTA级 4 bit 量化

DuQuant：基于正交变换实现大型语言模型的 SOTA级 4 bit 量化

2024-11-05

LLMC：大语言模型的量化基准

LLMC：大语言模型的量化基准

2024-10-11

mPLUG-Owl3：探索长序列模型架构的通用多模态大模型

mPLUG-Owl3：探索长序列模型架构的通用多模态大模型

2024-09-10

SGLang v0.2：面向 LLM 和 VLM 的快速、高效通用服务引擎

SGLang v0.2：面向 LLM 和 VLM 的快速、高效通用服务引擎

2024-09-03

S-LoRA：实现多 LoRA 大模型的高效并行化推理

S-LoRA：实现多 LoRA 大模型的高效并行化推理

2024-08-26

AWQ：激活值感知的LLM低位权重量化

AWQ：激活值感知的LLM低位权重量化

2024-08-14

SEED-Story：生成长篇图文故事的多模态大型语言模型

SEED-Story：生成长篇图文故事的多模态大型语言模型

2024-07-30

YOLO-World：基于视觉语言模型的实时开放词汇物体检测

YOLO-World：基于视觉语言模型的实时开放词汇物体检测

2024-07-23

MiniCPM-V：端侧可用的GPT-4V级多模态大模型

MiniCPM-V：端侧可用的GPT-4V级多模态大模型

2024-07-15

LLaMA Factory：从预训练到RLHF，大模型高效训练框架

LLaMA Factory：从预训练到RLHF，大模型高效训练框架

2024-07-08

VillagerAgent：减少幻觉、提高任务分解效率的多智能协作体框架

VillagerAgent：减少幻觉、提高任务分解效率的多智能协作体框架

2024-06-27

LLaMA Pro：扩展Transformer块优化的大型语言模型继续预训练

LLaMA Pro：扩展Transformer块优化的大型语言模型继续预训练

2024-06-17

PiSSA：收敛快、误差小的大模型参数高效微调方法

PiSSA：收敛快、误差小的大模型参数高效微调方法

2024-06-13

MixEval：混合评测数据集来拟合大语言模型的人类评估

MixEval：混合评测数据集来拟合大语言模型的人类评估

2024-05-24

Mini-Gemini：挖掘多模态视觉语言大模型的潜力

Mini-Gemini：挖掘多模态视觉语言大模型的潜力

2024-04-24

从 3D LLM 到 MultiPLY ，3D 具身基础模型的构建

从 3D LLM 到 MultiPLY ，3D 具身基础模型的构建

2024-04-19

ChatDev：大语言模型驱动的多智能体协作与演化

ChatDev：大语言模型驱动的多智能体协作与演化

2024-04-15