fix typo in deep gemm benchmarking(#3991)

50f28f65 · Xiaoyu Zhang · GitHub · 90a55e25 · 50f28f65
Unverified Commit 50f28f65 authored Mar 02, 2025 by Xiaoyu Zhang Committed by GitHub Mar 02, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 0 additions and 1 deletion

benchmark/kernels/deepseek/benchmark_deepgemm_fp8_gemm.py benchmark/kernels/deepseek/benchmark_deepgemm_fp8_gemm.py +0 -1

No files found.
--- a/benchmark/kernels/deepseek/benchmark_deepgemm_fp8_gemm.py
+++ b/benchmark/kernels/deepseek/benchmark_deepgemm_fp8_gemm.py
@@ -211,7 +211,6 @@ def get_benchmark(tp_size):
        x = torch.randn((m, k), device="cuda", dtype=torch.bfloat16)
        y = torch.randn((n, k), device="cuda", dtype=torch.bfloat16)
-        # 预处理数据，在计时之前完成
        x_fp8, x_scale = per_token_cast_to_fp8(x)
        y_fp8, y_scale = per_block_cast_to_fp8(y)
        x_scale_col_major = get_col_major_tma_aligned_tensor(x_scale.clone())