加载头像
大模型量化

2024

LLMC:大语言模型压缩工具的开发实践
LLMC:大语言模型压缩工具的开发实践
DuQuant: 基于正交变换实现大型语言模型的 SOTA级 4 bit 量化
DuQuant: 基于正交变换实现大型语言模型的 SOTA级 4 bit 量化
LLMC:大语言模型的量化基准
LLMC:大语言模型的量化基准
AWQ:激活值感知的LLM低位权重量化
AWQ:激活值感知的LLM低位权重量化
引用到评论
随便逛逛博客分类文章标签
复制地址关闭热评深色模式轉為繁體