Move all headers under same directory

29dbf01c · Po Yen, Chen · aee06365 · 29dbf01c · 29dbf01c · 29dbf01c
Commit 29dbf01c authored Jan 13, 2025 by Po Yen, Chen
12 changed files
--- a/example/ck_tile/18_paged_attention/include/attention/attention_dtypes.h
+++ b/example/ck_tile/18_paged_attention/include/attention/attention_dtypes.h
--- a/example/ck_tile/18_paged_attention/include/attention/attention_generic.cuh
+++ b/example/ck_tile/18_paged_attention/include/attention/attention_generic.cuh
--- a/example/ck_tile/18_paged_attention/include/attention/dtype_bfloat16.cuh
+++ b/example/ck_tile/18_paged_attention/include/attention/dtype_bfloat16.cuh
--- a/example/ck_tile/18_paged_attention/include/attention/dtype_float16.cuh
+++ b/example/ck_tile/18_paged_attention/include/attention/dtype_float16.cuh
--- a/example/ck_tile/18_paged_attention/include/attention/dtype_float32.cuh
+++ b/example/ck_tile/18_paged_attention/include/attention/dtype_float32.cuh
--- a/example/ck_tile/18_paged_attention/include/attention/dtype_fp8.cuh
+++ b/example/ck_tile/18_paged_attention/include/attention/dtype_fp8.cuh
--- a/example/ck_tile/18_paged_attention/include/cuda_compat.h
+++ b/example/ck_tile/18_paged_attention/include/cuda_compat.h
--- a/example/ck_tile/18_paged_attention/include/quantization/fp8/amd/hip_float8.h
+++ b/example/ck_tile/18_paged_attention/include/quantization/fp8/amd/hip_float8.h
--- a/example/ck_tile/18_paged_attention/include/quantization/fp8/amd/hip_float8_impl.h
+++ b/example/ck_tile/18_paged_attention/include/quantization/fp8/amd/hip_float8_impl.h
--- a/example/ck_tile/18_paged_attention/include/kernel/paged_attention_kernel.hpp
+++ b/example/ck_tile/18_paged_attention/include/kernel/paged_attention_kernel.hpp
@@ -17,12 +17,13 @@
 #pragma once
 #include <hip/hip_bf16.h>
-#include "cuda_compat.h"
 #include <algorithm>
 #include <cfloat>
-#include "attention/dtype_fp8.cuh"
-#include "quantization/fp8/amd/quant_utils.cuh"
+#include "dtype_fp8.cuh"
+#include "hip_compat.h"
+#include "quant_utils.cuh"
 #if defined(__HIPCC__) && \
    (defined(__gfx90a__) || defined(__gfx940__) || defined(__gfx941__) || defined(__gfx942__))

--- a/example/ck_tile/18_paged_attention/include/quantization/fp8/amd/quant_utils.cuh
+++ b/example/ck_tile/18_paged_attention/include/quantization/fp8/amd/quant_utils.cuh
@@ -5,7 +5,7 @@
 #include <hip/hip_bf16.h>
 #include <hip/hip_bfloat16.h>
-#include "../../../attention/attention_dtypes.h"
+#include "attention_dtypes.h"
 namespace vllm {
 #ifdef USE_ROCM

--- a/example/ck_tile/18_paged_attention/itfs/paged_attention.cpp
+++ b/example/ck_tile/18_paged_attention/itfs/paged_attention.cpp
@@ -19,7 +19,7 @@
 #include <hip/hip_runtime.h>
 #include "paged_attention.hpp"
-#include "kernel/paged_attention_kernel.hpp"
+#include "paged_attention_kernel.hpp"
 #define LAUNCH_CUSTOM_ATTENTION(GQA_RATIO)                        \
    paged_attention_ll4mi_QKV_kernel<T,                           \