mlx.core.dequantize

目录

mlx.core.dequantize#

dequantize(w: array, /, scales: array, biases: array, group_size: int = 64, bits: int = 4, *, stream: None | Stream | Device = None) array#

使用提供的 scalesbiases 以及 group_sizebits 配置对矩阵 w 进行反量化。

正式地,根据 quantize() 中的表示法,我们从 \(\hat{w_i}\) 以及相应的 \(s\)\(\beta\) 计算 \(w_i\) 如下:

\[w_i = s \hat{w_i} - \beta\]
参数:
  • w (array) – 待反量化的矩阵

  • scales (array) – 用于 w 中每个 group_size 元素的比例因子

  • biases (array) – 用于 w 中每个 group_size 元素的偏置

  • group_size (int, optional) – w 中共享比例因子和偏置的组大小。默认值:64

  • bits (int, optional) – w 中每个元素占用的位数。默认值:4

返回值:

w 的反量化版本

返回类型:

array