gemm_sm89.h 197 Bytes
Newer Older
1
2
#pragma once

3
4
#include <cute/arch/mma_sm89.hpp>

5
6
#include "cuda_fp8.h"

7
#include "gemm_mma.h"
8
9
10
11
12
13

namespace tl {
using tl_mma::gemm_rs;
using tl_mma::gemm_sr;
using tl_mma::gemm_ss;
} // namespace tl