benchmark_grouped_gemm_cutlass.py 10.6 KB