enable marlin kernels (#286)

d9b3b018 · Enrique Shockwave · GitHub · 745ea007 · d9b3b018
Unverified Commit d9b3b018 authored Mar 13, 2024 by Enrique Shockwave Committed by GitHub Mar 12, 2024
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 1 deletion

python/sglang/srt/managers/router/model_runner.py python/sglang/srt/managers/router/model_runner.py +2 -1

No files found.
--- a/python/sglang/srt/managers/router/model_runner.py
+++ b/python/sglang/srt/managers/router/model_runner.py
@@ -13,12 +13,13 @@ from sglang.srt.utils import is_multimodal_model
 from sglang.utils import get_available_gpu_memory
 from vllm.model_executor.layers.quantization.awq import AWQConfig
 from vllm.model_executor.layers.quantization.gptq import GPTQConfig
+from vllm.model_executor.layers.quantization.marlin import MarlinConfig
 from vllm.model_executor.model_loader import _set_default_torch_dtype
 from vllm.model_executor.parallel_utils.parallel_state import initialize_model_parallel
 import sglang
-QUANTIONCONFIG_MAPPING = {"awq": AWQConfig, "gptq": GPTQConfig}
+QUANTIONCONFIG_MAPPING = {"awq": AWQConfig, "gptq": GPTQConfig, "marlin": MarlinConfig}
 logger = logging.getLogger("model_runner")