fix(deploy.py): qkv no bias assertion

e0c7f51b · tpoisonooo · GitHub · 1b7151c1 · e0c7f51b
Unverified Commit e0c7f51b authored Jun 25, 2023 by tpoisonooo Committed by GitHub Jun 25, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

llmdeploy/serve/fastertransformer/deploy.py llmdeploy/serve/fastertransformer/deploy.py +1 -1

No files found.
--- a/llmdeploy/serve/fastertransformer/deploy.py
+++ b/llmdeploy/serve/fastertransformer/deploy.py
@@ -245,7 +245,7 @@ def deploy_llama(model_name: str, model_path: str, tokenizer_path: str,
            print(f'layers.{i}.attention.w_qkv.{t}', qkv.shape)
            model_params[f'layers.{i}.attention.w_qkv.{t}'] = qkv
-    assert num_layer == i, f'miss matched layers: {num_layer} vs {i}'
+    assert i == 0 or num_layer == i, f'miss matched layers: {num_layer} vs {i}'
    return export(model_name, num_layer, norm_eps, model_params,
                  tokenizer_path, triton_models_path, tp)