allow user to use custom calibration data for quantization

1712ce21 · Erwan BOEHM · abdc726c · 1712ce21 · 1712ce21
Commit 1712ce21 authored Sep 05, 2023 by Erwan BOEHM
Hide whitespace changes
Inline Side-by-side

Showing with 13 additions and 5 deletions

awq/models/base.py awq/models/base.py +3 -2

awq/utils/calib_data.py awq/utils/calib_data.py +10 -3

No files found.
--- a/awq/models/base.py
+++ b/awq/models/base.py
 import os
 import gc
 import json
+from typing import List, Union
 import torch
 import functools
 import torch.nn as nn
@@ -39,7 +40,7 @@ class BaseAWQForCausalLM(nn.Module):
    @torch.no_grad()
    def quantize(self, tokenizer=None, quant_config={}, n_samples=128, seqlen=512,
                       auto_scale=True, mse_range=True, run_search=True, run_quant=True,
-                       calib_data="pileval"):
+                       calib_data: Union[str, List[str]]="pileval"):
        self.quant_config = quant_config

        if run_search:
@@ -95,7 +96,7 @@ class BaseAWQForCausalLM(nn.Module):
            gc.collect()
    
    def _awq_search(self, tokenizer, quant_config, n_samples=128, seqlen=512,
-                       auto_scale=True, mse_range=True, calib_data="pileval"):
+                       auto_scale=True, mse_range=True, calib_data:Union[str, List[str]]="pileval"):
        layers = self.get_model_layers(self.model)

        samples = get_calib_dataset(

--- a/awq/utils/calib_data.py
+++ b/awq/utils/calib_data.py
+from typing import List, Union
 import torch
 import logging
 from datasets import load_dataset

-def get_calib_dataset(data="pileval", tokenizer=None, n_samples=512, block_size=512):
-    if data == "pileval":
-        dataset = load_dataset("mit-han-lab/pile-val-backup", split="validation")
+def get_calib_dataset(data: Union[str, List[str]] = "pileval", tokenizer=None, n_samples=512, block_size=512):
+    if isinstance(data, str):
+        if data == "pileval":
+            dataset = load_dataset("mit-han-lab/pile-val-backup", split="validation")
+        else:
+            raise NotImplementedError
+    elif isinstance(data, list):
+        dataset = [{"text": text} for text in data]
    else:
        raise NotImplementedError
+
    dataset = dataset.shuffle(seed=42)
    samples = []
    n_run = 0