mlx.core.dequantize#
- dequantize(w: array, /, scales: array, biases: array, group_size: int = 64, bits: int = 4, *, stream: None | Stream | Device = None) array #
使用提供的
scales
和biases
以及group_size
和bits
配置对矩阵w
进行反量化。正式地,根据
quantize()
中的表示法,我们从 \(\hat{w_i}\) 以及相应的 \(s\) 和 \(\beta\) 计算 \(w_i\) 如下:\[w_i = s \hat{w_i} - \beta\]