Skip to content

Latest commit

 

History

History
10 lines (8 loc) · 650 Bytes

README.md

File metadata and controls

10 lines (8 loc) · 650 Bytes

Neural network Model Compression Collection



简介

众所周知,模型压缩和加速对于深度神经网络的部署落地是必不可少的环节,NMCC旨在提供一整套深度学习算法模型相关的优化和部署工具,提高AI算法模型开发和部署环节的效率,从而更好地为实际场景业务赋能。

功能

目前NMCC主要支持基于PyTorch框架训练的模型量化和模型导出功能,如PTQ后量化方法和QAT量化训练算法等,包括通用的权重和激活4/6/8/16bit量化、Mixed-Precision量化,以及可微量化参数算法等。