rocblas_Flashocc.log 6.27 KB
Newer Older
雍大凯's avatar
雍大凯 committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
    118 ./rocblas-bench -f gemm_ex --transposeA T --transposeB N -m 1024 -n 2048 -k 25344 --alpha 1 --a_type f32_r --lda 25344 --b_type f32_r --ldb 25344 --beta 0 --c_type f32_r --ldc 1024 --d_type f32_r --ldd 1024 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
      2 ./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 256 -n 960000 -k 512 --alpha 1 --lda 256 --ldb 512 --beta 0 --ldc 256
      2 ./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB N -m 512 -n 960000 -k 288 --alpha 1 --lda 512 --ldb 288 --beta 0 --ldc 512
      2 ./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 256 -n 512 -k 960000 --alpha 1 --lda 256 --ldb 512 --beta 0 --ldc 256
      2 ./rocblas-bench -f gemm -r f32_r --transposeA N --transposeB T -m 512 -n 288 -k 960000 --alpha 1 --lda 512 --ldb 288 --beta 0 --ldc 512
      2 ./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 288 -n 960000 -k 512 --alpha 1 --lda 512 --ldb 512 --beta 1 --ldc 288
      2 ./rocblas-bench -f gemm -r f32_r --transposeA T --transposeB N -m 512 -n 960000 -k 256 --alpha 1 --lda 256 --ldb 256 --beta 0 --ldc 512
    948 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 11264 -n 256 -k 64 --alpha 1 --a_type f32_r --lda 11264 --stride_a 720896 --b_type f32_r --ldb 64 --stride_b 0 --beta 0 --c_type f32_r --ldc 11264 --stride_c 2883584 --d_type f32_r --ldd 11264 --stride_d 2883584 --batch_count 144 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    237 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 11264 -n 64 -k 64 --alpha 1 --a_type f32_r --lda 11264 --stride_a 720896 --b_type f32_r --ldb 64 --stride_b 0 --beta 0 --c_type f32_r --ldc 11264 --stride_c 720896 --d_type f32_r --ldd 11264 --stride_d 720896 --batch_count 144 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    948 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 2816 -n 512 -k 128 --alpha 1 --a_type f32_r --lda 2816 --stride_a 360448 --b_type f32_r --ldb 128 --stride_b 0 --beta 0 --c_type f32_r --ldc 2816 --stride_c 1441792 --d_type f32_r --ldd 2816 --stride_d 1441792 --batch_count 144 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    237 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 2816 -n 512 -k 256 --alpha 1 --a_type f32_r --lda 2816 --stride_a 720896 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 2816 --stride_c 1441792 --d_type f32_r --ldd 2816 --stride_d 1441792 --batch_count 144 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    119 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 40000 -n 256 -k 256 --alpha 1 --a_type f32_r --lda 40000 --stride_a 10240000 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 40000 --stride_c 10240000 --d_type f32_r --ldd 40000 --stride_d 10240000 --batch_count 24 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    119 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB N -m 704 -n 152 -k 256 --alpha 1 --a_type f32_r --lda 704 --stride_a 180224 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 704 --stride_c 107008 --d_type f32_r --ldd 704 --stride_d 107008 --batch_count 144 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    118 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 11264 -n 256 -k 128 --alpha 1 --a_type f32_r --lda 11264 --stride_a 1441792 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 11264 --stride_c 2883584 --d_type f32_r --ldd 11264 --stride_d 2883584 --batch_count 144 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    236 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 11264 -n 256 -k 64 --alpha 1 --a_type f32_r --lda 11264 --stride_a 720896 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 11264 --stride_c 2883584 --d_type f32_r --ldd 11264 --stride_d 2883584 --batch_count 144 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    118 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 2816 -n 256 -k 512 --alpha 1 --a_type f32_r --lda 2816 --stride_a 1441792 --b_type f32_r --ldb 256 --stride_b 0 --beta 0 --c_type f32_r --ldc 2816 --stride_c 720896 --d_type f32_r --ldd 2816 --stride_d 720896 --batch_count 144 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    118 ./rocblas-bench -f gemm_strided_batched_ex --transposeA N --transposeB T -m 704 -n 512 -k 1024 --alpha 1 --a_type f32_r --lda 704 --stride_a 720896 --b_type f32_r --ldb 512 --stride_b 0 --beta 0 --c_type f32_r --ldc 704 --stride_c 360448 --d_type f32_r --ldd 704 --stride_d 360448 --batch_count 144 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    118 ./rocblas-bench -f gemm_strided_batched_ex --transposeA T --transposeB N -m 512 -n 512 -k 9600 --alpha 1 --a_type f32_r --lda 9600 --stride_a 4915200 --b_type f32_r --ldb 9600 --stride_b 4915200 --beta 0 --c_type f32_r --ldc 512 --stride_c 262144 --d_type f32_r --ldd 512 --stride_d 262144 --batch_count 49 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
    118 ./rocblas-bench -f gemm_strided_batched_ex --transposeA T --transposeB N -m 512 -n 640 -k 9600 --alpha 1 --a_type f32_r --lda 9600 --stride_a 4915200 --b_type f32_r --ldb 9600 --stride_b 6144000 --beta 0 --c_type f32_r --ldc 512 --stride_c 327680 --d_type f32_r --ldd 512 --stride_d 327680 --batch_count 49 --compute_type f32_r --algo 0 --solution_index 0 --flags 0
      2 ./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 3 -n 1 -k 3 --alpha 1 --lda 3 --stride_a 9 --ldb 3 --stride_b 3 --beta 0 --ldc 3 --stride_c 3 --batch_count 8921088
      2 ./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 3 -n 3 -k 3 --alpha 1 --lda 3 --stride_a 9 --ldb 4 --stride_b 16 --beta 0 --ldc 3 --stride_c 9 --batch_count 144
      4 ./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB T -m 3 -n 1 -k 3 --alpha 1 --lda 3 --stride_a 9 --ldb 1 --stride_b 3 --beta 0 --ldc 3 --stride_c 3 --batch_count 8921088
    238 ./rocblas-bench -f gemm_strided_batched -r f64_r --transposeA N --transposeB N -m 4 -n 4 -k 4 --alpha 1 --lda 4 --stride_a 16 --ldb 4 --stride_b 16 --beta 0 --ldc 4 --stride_c 16 --batch_count 144