mlx.core.dequantize#

dequantize(w: array, /, scales: array, biases: array, group_size: int = 64, bits: int = 4, *, stream: None | Stream | Device = None) → array#

使用提供的 scales 和 biases 以及 group_size 和 bits 配置对矩阵 w 进行反量化。

正式地，根据 quantize() 中的表示法，我们从 \(\hat{w_i}\) 以及相应的 \(s\) 和 \(\beta\) 计算 \(w_i\) 如下：

\[w_i = s \hat{w_i} - \beta\]

参数:

返回值:

w 的反量化版本

返回类型:

array

mlx.core.dequantize