Fix `text-generation-server quantize` (#2103)

The subcommand did not work due to some broken imports.

Fix `text-generation-server quantize` (#2103)
The subcommand did not work due to some broken imports.
197c47a3 · Daniël de Kok · GitHub · bcb3faa1 · 197c47a3 · 197c47a3
Unverified Commit 197c47a3 authored Jun 21, 2024 by Daniël de Kok Committed by GitHub Jun 21, 2024
Showing with 2 additions and 2 deletions

server/text_generation_server/cli.py server/text_generation_server/cli.py +1 -1

server/text_generation_server/layers/gptq/quantize.py server/text_generation_server/layers/gptq/quantize.py +1 -1

No files found.
--- a/server/text_generation_server/cli.py
+++ b/server/text_generation_server/cli.py
@@ -316,7 +316,7 @@ def quantize(
        logger_level=logger_level,
        json_output=json_output,
    )
-    from text_generation_server.utils.gptq.quantize import quantize
+    from text_generation_server.layers.gptq.quantize import quantize

    quantize(
        model_id=model_id,

--- a/server/text_generation_server/layers/gptq/quantize.py
+++ b/server/text_generation_server/layers/gptq/quantize.py
@@ -12,7 +12,7 @@ from huggingface_hub import HfApi
 from accelerate import init_empty_weights
 from text_generation_server.utils import initialize_torch_distributed, Weights
 from text_generation_server.utils.hub import weight_files
-from text_generation_server.utils.gptq.quant_linear import QuantLinear
+from text_generation_server.layers.gptq.quant_linear import QuantLinear
 from loguru import logger
 from typing import Optional