Blame · src/kernels/gemm_w8a8.h · b737368d2549a05670191950df6e9aec8ce9fff6 · fengzch-das / nunchaku · GitLab

Switch branch/tag

nunchaku

src

kernels

gemm_w8a8.h
Find file
Normal viewHistoryPermalink

gemm_w8a8.h

247 Bytes

Newer

Older

Initial release

Zhekai Zhang
committed
Nov 07, 2024

#pragma once

#include "common.h"
#include "Tensor.h"

Tensor gemm_w8a8_fp16(Tensor input,  // INT8
                      Tensor weight, // INT8
                      Tensor out,
                      half scale,
                      half bias
);