Neural network Model Compression Collection 简介 众所周知,模型压缩和加速对于深度神经网络的部署落地是必不可少的环节,NMCC旨在提供一整套深度学习算法模型相关的优化和部署工具,提高AI算法模型开发和部署环节的效率,从而更好地为实际场景业务赋能。 功能 目前NMCC主要支持基于PyTorch框架训练的模型量化和模型导出功能,如PTQ后量化方法和QAT量化训练算法等,包括通用的权重和激活4/6/8/16bit量化、Mixed-Precision量化,以及可微量化参数算法等。