Avoid fusing for larger Falcon models

e3936a44 · Casper Hansen · 3256ffec · e3936a44
Commit e3936a44 authored Sep 20, 2023 by Casper Hansen
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 1 deletion

awq/models/falcon.py awq/models/falcon.py +4 -1

No files found.
--- a/awq/models/falcon.py
+++ b/awq/models/falcon.py
@@ -7,7 +7,10 @@ class FalconAWQForCausalLM(BaseAWQForCausalLM):
    @staticmethod
    def fuse_layers(model: FalconForCausalLM, quant_config:dict):
        fuser = FalconFuser(model)
-        fuser.fuse_transformer()
+        # TODO: Implement correctly fused modules for Falcon 40B and Falcon 180B
+        if model.config.num_attention_heads == 71:
+            fuser.fuse_transformer()
    @staticmethod
    def get_model_layers(model: FalconForCausalLM):