文献阅读(56)

Kersen ·
更新时间:2024-11-13
· 564 次阅读

文章目录1 缩写 & 引用2 abstract & introduction 题目:Deep Compression compressing deep neural networks with pruning, train quantization and huffman coding 时间:2016 会议:ICLR 研究机构:韩松 可以参考的博客:https://blog.csdn.net/u013082989/article/details/77915375 1 缩写 & 引用 2 abstract & introduction

在这里插入图片描述
提出的deep compression分三步:减枝、量化、霍夫曼编码

减枝:权重小于阈值的就去掉,这样就可以用稀疏矩阵的格式如CSR和CSC来存储权重 量化:利用了weight sharing,存一个对照表,这样就只需要存index而不是确定的值,实现过程用到了k-means,当然也要retrain 霍夫曼编码:权重的index、稀疏矩阵的index都不是均匀的,这就适合霍夫曼压缩了

在这里插入图片描述

在这里插入图片描述


作者:tiaozhanzhe1900



文献

需要 登录 后方可回复, 如果你还没有账号请 注册新账号
相关文章