x (array) – 输入数组
w (array) – 打包在无符号整数中的量化矩阵
scales (array) – 用于 w 中每 group_size 个元素的比例
biases (array) – 用于 w 中每 group_size 个元素的偏差
transpose (bool, 可选) – 定义是否与 w 的转置进行乘法运算,即是否执行 x @ w.T 或 x @ w。默认值: True。
group_size (int, 可选) – w 中共享比例和偏差的组大小。默认值: 64。
bits (int, 可选) – w 中每个元素占用的位数。默认值: 4。