Import torch before flash_attn_2_cuda

d431f167 · Tri Dao · 0e8c46ae · d431f167
Commit d431f167 authored Aug 19, 2023 by Tri Dao
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 1 deletion

flash_attn/flash_attn_interface.py flash_attn/flash_attn_interface.py +5 -1

No files found.
--- a/flash_attn/flash_attn_interface.py
+++ b/flash_attn/flash_attn_interface.py
-import flash_attn_2_cuda as flash_attn_cuda
 import torch
 import torch.nn as nn
 from einops import rearrange
+# isort: off
+# We need to import the CUDA kernels after importing torch
+import flash_attn_2_cuda as flash_attn_cuda
+# isort: on
 def _get_block_size(device, head_dim, is_dropout, is_causal):
    # This should match the block sizes in the CUDA kernel