主仓库
01-论文
1bit LLMS
模型量化
无损压缩
异常感知(论文原文)
Atom
AWQ
GPTQ
GPTQ(原文)
KIVI
KVquant
LLM.int8()
nnzip
OBC(高效压缩)
OLAccel
QLoRA
Qserve
Qserve(原文)
SmoothQuant
Tender
Zeroquant
03-读书笔记
2024年9月5日_《金字塔原理》读书报告
2024年9月28日_《逻辑的力量》
华为饱和营销攻击法读后感
人性的弱点
深度工作
数字极简
思维导图的作用
鱼没有脚
做读书笔记
index
created_date
:
2024-11-25
modified_date
:
2024
-
12
-
2
2024-12-2
量化权重矩阵
任意顺序洞察
惰性批量更新
Cholesky
重新表述
算法伪码如下:
Table Of Contents
2024-12-2
量化权重矩阵