Clarify 4/8 bit loading log message (#25134)

* clarify 4/8 bit loading log message * make style

Clarify 4/8 bit loading log message (#25134)
* clarify 4/8 bit loading log message * make style
9a220ce3 · Bram Vanroy · GitHub · 9429642e · 9a220ce3
Unverified Commit 9a220ce3 authored Jul 27, 2023 by Bram Vanroy Committed by GitHub Jul 27, 2023
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 2 deletions

src/transformers/modeling_utils.py src/transformers/modeling_utils.py +4 -2

No files found.
--- a/src/transformers/modeling_utils.py
+++ b/src/transformers/modeling_utils.py
@@ -2734,8 +2734,10 @@ class PreTrainedModel(nn.Module, ModuleUtilsMixin, GenerationMixin, PushToHubMix

            llm_int8_skip_modules = quantization_config.llm_int8_skip_modules
            load_in_8bit_fp32_cpu_offload = quantization_config.llm_int8_enable_fp32_cpu_offload
-
+            if load_in_8bit:
                logger.info("Detected 8-bit loading: activating 8-bit loading for this model")
+            else:
+                logger.info("Detected 4-bit loading: activating 4-bit loading for this model")

            # We keep some modules such as the lm_head in their original dtype for numerical stability reasons
            if llm_int8_skip_modules is None: