profiler/src/profiler.cpp · 2778e99758e149a6cb5309ca307bf7c1e61a562f · gaoqiong / composable_kernel_ROCM

zjing14 authored Feb 11, 2022

* prepare host for batched_gemm

* init commit of batched kernels

* fixed

* refine transform with freeze

* m/n padding

* fixed a bug; clean

* add small tiles

* clean

* clean code

* clean code

* add nt, tn, tt layout

* add missing file

* use StaticBufferTupleOfVector instead

* add reference_batched_gemm

* fixed a macro

b53e9d08

profiler.cpp 2.09 KB

Replace profiler.cpp