added batched fla fwd bf16 dropout verify

2299a4f1 · guangzlu · 893ee0bc · 2299a4f1
Commit 2299a4f1 authored Feb 17, 2023 by guangzlu
Hide whitespace changes
Inline Side-by-side

Showing with 8 additions and 0 deletions

example/32_batched_gemm_scale_softmax_gemm/batched_multihead_attention_forward_bf16.cpp ...softmax_gemm/batched_multihead_attention_forward_bf16.cpp +8 -0

No files found.
--- a/example/32_batched_gemm_scale_softmax_gemm/batched_multihead_attention_forward_bf16.cpp
+++ b/example/32_batched_gemm_scale_softmax_gemm/batched_multihead_attention_forward_bf16.cpp
@@ -27,12 +27,14 @@ Gemm + Softmax + Gemm fused operation. Computes C_g_m_o = Softmax(A_g_m_k * B0_g
 #include "ck/library/utility/literals.hpp"
 #include "ck/library/reference_tensor_operation/cpu/reference_batched_gemm.hpp"
 #include "ck/library/reference_tensor_operation/cpu/reference_softmax.hpp"
+#include "ck/library/reference_tensor_operation/cpu/reference_dropout.hpp"
 template <ck::index_t... Is>
 using S = ck::Sequence<Is...>;
 using BF16 = ck::bhalf_t;
 using F32  = float;
+using U16  = unsigned short;
 using PassThrough = ck::tensor_operation::element_wise::PassThrough;
@@ -42,6 +44,7 @@ using B1DataType       = BF16;
 using AccDataType      = F32;
 using CShuffleDataType = F32;
 using CDataType        = BF16;
+using ZDataType        = U16;
 using LSEDataType      = F32;
 using Acc0BiasDataType = ck::Tuple<>;
 using Acc1BiasDataType = ck::Tuple<>;
@@ -78,6 +81,7 @@ using DeviceGemmInstance =
        B0DataType,
        B1DataType,
        CDataType,
+        ZDataType,
        LSEDataType,
        Acc0BiasDataType,
        Acc1BiasDataType,
@@ -157,6 +161,10 @@ using ReferenceGemm1Instance = ck::tensor_operation::host::ReferenceBatchedGemm<
                                                                                B1ElementOp,
                                                                                CElementOp>;
+// Ref dropout
+using ReferenceDropoutInstance =
+    ck::tensor_operation::host::ReferenceDropout<ZDataType, ADataType, ADataType>;
 #include "run_batched_multihead_attention_forward.inc"
 int main(int argc, char* argv[]) { return run(argc, argv); }