add comments

bcfdeb38 · twaka · ad45716f · bcfdeb38
Commit bcfdeb38 authored Oct 17, 2023 by twaka
Hide whitespace changes
Inline Side-by-side

Showing with 10 additions and 9 deletions

awq/models/gpt_neox.py awq/models/gpt_neox.py +10 -9

No files found.
--- a/awq/models/gpt_neox.py
+++ b/awq/models/gpt_neox.py
 from .base import BaseAWQForCausalLM
-from typing import Dict
 from transformers.models.gpt_neox.modeling_gpt_neox import GPTNeoXLayer, GPTNeoXForCausalLM

 class GPTNeoXAWQForCausalLM(BaseAWQForCausalLM):
@@ -34,14 +33,16 @@ class GPTNeoXAWQForCausalLM(BaseAWQForCausalLM):
            inp=input_feat['attention.query_key_value'],
        ))

-        # # attention out
-        # layers.append(dict(
-        #     prev_op=module.attention.query_key_value,
-        #     layers=[module.attention.dense],
-        #     inp=input_feat['attention.dense'],
-        # ))
-        
-        # NOTE: assumes "use_parallel_residual": false
+        # attention out
+        # Please refer to https://github.com/mit-han-lab/llm-awq/issues/2#issuecomment-1606297469
+        """
+        layers.append(dict(
+            prev_op=module.attention.query_key_value,
+            layers=[module.attention.dense],
+            inp=input_feat['attention.dense'],
+        ))
+        """
+
        # linear 1
        layers.append(dict(
            prev_op=module.post_attention_layernorm,