[Minor] Merge model initilization

6371c3a0 · Jiaming Tang · e04d0ec7 · 6371c3a0
Commit 6371c3a0 authored Jul 04, 2023 by Jiaming Tang
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 17 deletions

awq/entry.py awq/entry.py +4 -17

No files found.
--- a/awq/entry.py
+++ b/awq/entry.py
@@ -92,22 +92,14 @@ def build_model_and_enc(model_path):
        )
    else:  # fp16 to quantized
        args.run_awq &= not args.load_awq  # if load_awq, no need to run awq
+        # Init model on CPU:
        kwargs = {"torch_dtype": torch.float16, "low_cpu_mem_usage": True}
+        model = AutoModelForCausalLM.from_pretrained(
+            model_path, config=config, trust_remote_code=True, **kwargs)
        if args.run_awq:
            assert args.dump_awq, "Please save the awq results with --dump_awq"
-            # Init model on CPU
-            def skip(*args, **kwargs):
-                pass
-            torch.nn.init.kaiming_normal_ = skip
-            torch.nn.init.kaiming_uniform_ = skip
-            torch.nn.init.uniform_ = skip
-            torch.nn.init.normal_ = skip
-            model = AutoModelForCausalLM.from_pretrained(
-                model_path, config=config, trust_remote_code=True, **kwargs)
            awq_results = run_awq(
                model, enc,
                w_bit=args.w_bit, q_config=q_config,
@@ -121,11 +113,6 @@ def build_model_and_enc(model_path):
                print("AWQ results saved at", args.dump_awq)
            exit(0)
-        else:
-            # Inference with fake quant
-            # Init model on CPU:
-            model = AutoModelForCausalLM.from_pretrained(
-                model_path, config=config, trust_remote_code=True, **kwargs)
        if args.load_awq:
            print("Loading pre-computed AWQ results from", args.load_awq)