Blame · src/kernels/gemm_batched.h · 37c494a74a267c551c947640476fb7eb248ec950 · fengzch-das / nunchaku · GitLab

Switch branch/tag

nunchaku

src

kernels

gemm_batched.h
Find file
Normal viewHistoryPermalink

gemm_batched.h

257 Bytes

Newer

Older

Initial release

Zhekai Zhang
committed
Nov 07, 2024

#pragma once

#include "common.h"
#include "Tensor.h"

Tensor gemm_batched_fp16(
    Tensor a,   // FP16 row-major [(... batch ...), M, K]
    Tensor b,   // FP16 col-major [(... batch ...), N, K]
    Tensor out  // FP32 row-major [(... batch ...), M, N]
);