Update e8m0 casting

b1ad4b4f · Rostyslav Geyyer · bdc1dd6f · b1ad4b4f · b1ad4b4f
Commit b1ad4b4f authored Nov 22, 2024 by Rostyslav Geyyer
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 2 deletions

include/ck/utility/data_type.hpp include/ck/utility/data_type.hpp +1 -0

include/ck/utility/e8m0_utils.hpp include/ck/utility/e8m0_utils.hpp +4 -2

No files found.
--- a/include/ck/utility/data_type.hpp
+++ b/include/ck/utility/data_type.hpp
@@ -16,6 +16,7 @@ using bf8_t   = unsigned _BitInt(8);

 struct e8m0_scale_t
 {
+    // E8M0 scale is biased
    using type = uint8_t;
    type data;
    constexpr e8m0_scale_t() : data{type{}} {}

--- a/include/ck/utility/e8m0_utils.hpp
+++ b/include/ck/utility/e8m0_utils.hpp
@@ -10,12 +10,14 @@ namespace ck::utils {

 __host__ __device__ inline float cast_to_float(e8m0_scale_t const scale)
 {
-    return std::pow(2, bit_cast<uint8_t>(scale) - NumericUtils<e8m0_scale_t>::bias);
+    // TODO: check performance and try bit shift impl
+    return std::powf(2, bit_cast<uint8_t>(scale) - NumericUtils<e8m0_scale_t>::bias);
 }

 __host__ __device__ inline e8m0_scale_t cast_from_float(float const scale)
 {
-    return static_cast<uint8_t>(std::log2(scale) + NumericUtils<e8m0_scale_t>::bias);
+    uint32_t e = bit_cast<uint32_t>(scale) & NumericUtils<float>::nan_mask;
+    return static_cast<uint8_t>(e >> 23);
 }

 template <>