没有合适的资源?快使用搜索试试~ 我知道了~
aimet:AIMET是一个为经过训练的神经网络模型提供高级量化和压缩技术的库
共491个文件
py:245个
png:48个
cpp:41个
需积分: 50 1 下载量 116 浏览量
2021-03-19
15:24:20
上传
评论
收藏 3.57MB ZIP 举报
温馨提示
AI模型效率工具包(AIMET) 是一个为经过训练的神经网络模型提供高级模型量化和压缩技术的库。它提供的功能已被证明可改善深度学习神经网络模型的运行时性能,同时具有较低的计算和内存需求,并且对任务准确性的影响最小。 AIMET设计用于和模型。 我们还托管-一组针对8位推理进行了优化的流行神经网络模型。我们还为用户提供了使用AIMET量化浮点模型的方法。 目录 为什么选择AIMET? 支持高级量化技术:使用整数运行时的推理比使用浮点运行时的推理要快得多。例如,模型在Qualcomm Hexagon DSP上的运行速度比在Qualcomm Kyro CPU上的运行速度快5到15倍。此外,8位精度模型的占用空间比32位精度模型小4倍。但是,在对ML模型进行量化时,保持模型的准确性通常具有挑战性。 AIMET使用无数据量化等新颖技术解决了这一问题,该技术可在几种流行模型上提供最新的INT8结果
资源推荐
资源详情
资源评论
收起资源包目录
aimet:AIMET是一个为经过训练的神经网络模型提供高级量化和压缩技术的库 (491个子文件)
.clang-format 2KB
package_aimet.cmake 5KB
commit-msg 3KB
SvdAlgorithm.cpp 43KB
test_dlcompression_svd.cpp 30KB
PyModelOptimizations.cpp 15KB
test_quantization_lib_tf_enhanced_cpugpu.cpp 14KB
test_gemm_fxp_acc.cpp 13KB
QcQuantizeOpDeprecated.cpp 13KB
TfEnhancedEncodingAnalyzer.cpp 13KB
TestTfEnhancedEncodingAnalyzer.cpp 13KB
math_functions.cpp 12KB
TestTfEncodingAnalyzer.cpp 11KB
MainQuantizationClass.cpp 10KB
TestDLEqualization.cpp 10KB
QcQuantizeRecurrentParamOp.cpp 9KB
BiasCorrection.cpp 9KB
test_quantization_lib_tf_cpu.cpp 8KB
test_quantization_lib_tf_cpugpu.cpp 8KB
QcQuantizeOp.cpp 8KB
TfQuantizer.cpp 7KB
CrossLayerScaling.cpp 7KB
QcQuantizeStaticOp.cpp 7KB
TensorOperations.cpp 6KB
TfEncodingAnalyzer.cpp 6KB
ScaleFactorCalculator.cpp 6KB
TestTensorQuantizationSim.cpp 6KB
TfEnhancedQuantizer.cpp 6KB
TensorQuantizer.cpp 5KB
AimetTensorQuantizer.cpp 5KB
TestTensorQuantizer.cpp 5KB
trim_functions.cpp 5KB
BatchNormFold.cpp 5KB
BiasCorrectionForPython.cpp 5KB
QuantizerFactory.cpp 4KB
CrossLayerScalingForPython.cpp 4KB
TensorQuantizationSim.cpp 4KB
EncodingAnalyzerForPython.cpp 4KB
HighBiasFold.cpp 4KB
TensorQuantizationSimForPython.cpp 4KB
HighBiasFoldForPython.cpp 3KB
BatchNormFoldForPython.cpp 3KB
AimetOpUtils.cpp 3KB
PyTrainingExtensions.cpp 3KB
resnet18_eval_scores.csv 940B
resnet50_eval_scores.csv 146B
QcQuantizeOpGpuDeprecated.cu 6KB
math_functions.cu 4KB
AimetOpUtilsGpu.cu 3KB
trim_functions.cu 3KB
cuda_util.cu 3KB
trim_functions.cuh 4KB
Dockerfile 9KB
.gitignore 587B
TfEnhancedEncodingAnalyzer.h 7KB
TensorQuantizer.h 6KB
BiasCorrection.h 4KB
TensorOperations.h 4KB
CrossLayerScaling.h 4KB
BiasCorrectionForPython.h 4KB
CrossLayerScalingForPython.h 4KB
TensorQuantizerOpFacade.h 4KB
ScaleFactorCalculator.h 4KB
BatchNormFoldForPython.h 3KB
TfEncodingAnalyzer.h 3KB
BatchNormFold.h 3KB
HighBiasFoldForPython.h 3KB
HighBiasFold.h 3KB
EncodingAnalyzerForPython.h 3KB
TensorQuantizationSim.h 3KB
AimetOpUtils.h 3KB
TensorQuantizationSimForPython.h 3KB
def.h 2KB
ITensorQuantizationSim.h 2KB
common.h 2KB
SvdAlgorithm.hpp 25KB
ISVD.hpp 14KB
IQuantizer.hpp 10KB
qc_quantizer.hpp 7KB
math_functions.hpp 6KB
test_quantization_lib.hpp 6KB
MainQuantizationClass.hpp 5KB
TfEnhancedQuantizer.hpp 5KB
IQuantizationEncodingAnalyzer.hpp 4KB
TfQuantizer.hpp 4KB
QuantizerFactory.hpp 4KB
IQuantizationAlgorithm.hpp 3KB
QcQuantizeOpDeprecated.hpp 3KB
Quantization.hpp 3KB
cuda_util.hpp 3KB
trim_functions.hpp 3KB
QcQuantizeStaticOp.hpp 2KB
QcQuantizeRecurrentParamOp.hpp 2KB
QcQuantizeOp.hpp 2KB
setup.py.in 2KB
package_info.py.in 2KB
pytest.ini 91B
pytest.ini 91B
pytest.ini 91B
Install_AIMET_GoogleColab.ipynb 57KB
共 491 条
- 1
- 2
- 3
- 4
- 5
资源评论
A玩具爆款孙大帅
- 粉丝: 25
- 资源: 4712
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- java的概要介绍与分析
- MoonBit 编译器.MoonBit - 文档 - 概览 - 标准库.MoonBit 是一个用户友好,构建快,产出质量高的编程语言
- 解决微电网调度中的两阶段鲁棒优化问题,考虑了风电出力和负荷功率的不确定性,通过迭代求解主问题和子问题,最终得到最优的调度方案,并绘制了风电出力、负荷功率、购售电功率、充放电功率和储能调度结果等相关图表
- wireshark免安装版本 WiresharkPortable64-4.4.2
- springboot-基于springboot的房屋租赁管理系统
- ssm员工工作日志管理系统-lw.zip
- 人脸疲劳图像目标检测数据【已标注,约10,000张数据,YOLO 标注格式】
- 123456789.py
- RouterHandler
- 页面居中设置的process
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功