Commit b52f967e authored by one's avatar one
Browse files

Update README with additional GEMV benchmark commands and parameter details

parent 57774b4a
...@@ -4,10 +4,10 @@ GEMV Benchmarks ...@@ -4,10 +4,10 @@ GEMV Benchmarks
模仿 GEMM 接口的 GEMV,即 N=1,实现 BF16 版本。这些矩阵形状来自于 Evo2 推理过程。 模仿 GEMM 接口的 GEMV,即 N=1,实现 BF16 版本。这些矩阵形状来自于 Evo2 推理过程。
计算公式:y = alpha * A^T * x + beta * y 计算公式:y = alpha * A^T * x + beta * y
M: 输出维度,例如 11264 - M: 输出维度,例如 11264
K: 归约维度,例如 4096 - K: 归约维度,例如 4096
N: 始终为 1 - N: 始终为 1
beta: 为 0 或 1 - beta: 为 0 或 1
## Build ## Build
...@@ -23,8 +23,14 @@ CXX=nvcc make GPU_ARCH=sm_80 ...@@ -23,8 +23,14 @@ CXX=nvcc make GPU_ARCH=sm_80
```bash ```bash
# BW系列: # BW系列:
HIP_VISIBLE_DEVICES=1 numactl -N 0 -m 0 ./gemv_bench --verify 1 -M 11264 -K 4096 HIP_VISIBLE_DEVICES=1 numactl -N 0 -m 0 ./gemv_bench --verify 1 -M 11264 -K 4096 --alpha 1 --beta 0 -B 128
HIP_VISIBLE_DEVICES=1 numactl -N 0 -m 0 ./gemv_bench --verify 1 -M 4096 -K 11264 --alpha 1 --beta 0 -B 128
HIP_VISIBLE_DEVICES=1 numactl -N 0 -m 0 ./gemv_bench --verify 1 -M 12288 -K 4096 --alpha 1 --beta 0 -B 128
HIP_VISIBLE_DEVICES=1 numactl -N 0 -m 0 ./gemv_bench --verify 1 -M 4096 -K 4096 --alpha 1 --beta 1 -B 128
# A800: # A800:
./gemv_bench --verify 1 -M 11264 -K 4096 ./gemv_bench --verify 1 -M 11264 -K 4096 --alpha 1 --beta 0 -B 256
./gemv_bench --verify 1 -M 4096 -K 11264 --alpha 1 --beta 0 -B 256
./gemv_bench --verify 1 -M 12288 -K 4096 --alpha 1 --beta 0 -B 256
./gemv_bench --verify 1 -M 4096 -K 4096 --alpha 1 --beta 1 -B 256
``` ```
\ No newline at end of file
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment