Python get_quantized_range示例

编程语言: Python

命名空间/包名称: distiller.quantization.q_utils

方法/功能: get_quantized_range

hotexamples.com的示例: 3

Python get_quantized_range - 已找到3个示例。这些是从开源项目中提取的最受好评的distiller.quantization.q_utils.get_quantized_range现实Python示例。您可以评价示例，以帮助我们提高示例质量。

示例#1

显示文件

def test_get_quantized_range(num_bits, signed, restrict, expected_q_min,
                             expected_q_max):
    q_min, q_max = qu.get_quantized_range(num_bits,
                                          signed=signed,
                                          signed_restrict_qrange=restrict)
    assert q_min == expected_q_min
    assert q_max == expected_q_max

示例#2

显示文件

def attach_quant_metadata(t, num_bits, quant_mode, stats=None, clip_mode=ClipMode.NONE, per_channel=False,
                          num_stds=None, scale_approx_mult_bits=None):
    if stats is None:
        scale, zp = _get_quant_params_from_tensor(t, num_bits, quant_mode, clip_mode, per_channel, num_stds,
                                                  scale_approx_mult_bits)
    else:
        scale, zp = _get_quant_params_from_stats_dict(stats, num_bits, quant_mode, clip_mode, num_stds,
                                                      scale_approx_mult_bits)
    signed = quant_mode != LinearQuantMode.ASYMMETRIC_UNSIGNED
    restrict = quant_mode == LinearQuantMode.SYMMETRIC_RESTRICTED
    min_q_val, max_q_val = q_utils.get_quantized_range(num_bits, signed)
    t.quant_metadata = TensorQuantMetadata(scale, zp, min_q_val, max_q_val)
    return t

示例#3

显示文件

def _fake_quant_tensor(tensor, n_bits, mode, per_channel):
    q_min, q_max = q_utils.get_quantized_range(
        n_bits, mode != LinearQuantMode.ASYMMETRIC_UNSIGNED)
    scale, zp = _get_quant_params_from_tensor(tensor,
                                              n_bits,
                                              mode,
                                              per_channel=per_channel)
    q_utils.linear_quantize_clamp(tensor,
                                  scale,
                                  zp,
                                  q_min,
                                  q_max,
                                  inplace=True)
    q_utils.linear_dequantize(tensor, scale, zp, inplace=True)