Update to Cutlass 3.5

d732be1e · Tri Dao · af627063 · 7d49e6c7 · bbe579a9 · 7d49e6c7
Commit d732be1e authored May 26, 2024 by Tri Dao
7 changed files
--- a/cutlass @ 7d49e6c7
+++ b/cutlass @ 7d49e6c7
-Subproject commit bbe579a9e3beb6ea6626d9227ec32d0dae119a49
+Subproject commit 7d49e6c7e2f8896c47f586706e67e1fb215529dc
--- a/csrc/flash_attn/src/flash_bwd_kernel.h
+++ b/csrc/flash_attn/src/flash_bwd_kernel.h
@@ -4,7 +4,7 @@
 #pragma once
-#include <cute/algorithm/copy.hpp>
+#include <cute/tensor.hpp>
 #include <cutlass/cutlass.h>
 #include <cutlass/array.h>

--- a/csrc/flash_attn/src/flash_bwd_preprocess_kernel.h
+++ b/csrc/flash_attn/src/flash_bwd_preprocess_kernel.h
@@ -4,7 +4,7 @@
 #pragma once
-#include <cute/algorithm/copy.hpp>
+#include <cute/tensor.hpp>
 #include <cutlass/cutlass.h>
 #include <cutlass/array.h>

--- a/csrc/flash_attn/src/flash_fwd_kernel.h
+++ b/csrc/flash_attn/src/flash_fwd_kernel.h
@@ -4,7 +4,7 @@
 #pragma once
-#include <cute/algorithm/copy.hpp>
+#include <cute/tensor.hpp>
 #include <cutlass/cutlass.h>
 #include <cutlass/array.h>

--- a/csrc/flash_attn/src/kernel_traits.h
+++ b/csrc/flash_attn/src/kernel_traits.h
@@ -4,7 +4,7 @@
 #pragma once
-#include "cute/algorithm/copy.hpp"
+#include "cute/tensor.hpp"
 #include "cutlass/cutlass.h"
 #include "cutlass/layout/layout.h"

--- a/csrc/flash_attn/src/rotary.h
+++ b/csrc/flash_attn/src/rotary.h
@@ -4,7 +4,7 @@
 #pragma once
-#include <cute/algorithm/copy.hpp>
+#include <cute/tensor.hpp>
 #include "utils.h"

--- a/csrc/flash_attn/src/utils.h
+++ b/csrc/flash_attn/src/utils.h
@@ -14,8 +14,7 @@
 #include <cuda_bf16.h>
 #endif
-#include <cute/algorithm/copy.hpp>
+#include <cute/tensor.hpp>
-#include <cute/algorithm/gemm.hpp>
 #include <cutlass/array.h>
 #include <cutlass/cutlass.h>