Fix squeeze into torch 1.x compatible form in llama model (#22808)

fix-squeeze-tuple

Fix squeeze into torch 1.x compatible form in llama model (#22808)
fix-squeeze-tuple
f8c43c94 · Kunhao ZHENG · GitHub · 5269718c · f8c43c94
Unverified Commit f8c43c94 authored Apr 17, 2023 by Kunhao ZHENG Committed by GitHub Apr 17, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

src/transformers/models/llama/modeling_llama.py src/transformers/models/llama/modeling_llama.py +2 -2

No files found.
--- a/src/transformers/models/llama/modeling_llama.py
+++ b/src/transformers/models/llama/modeling_llama.py
@@ -132,8 +132,8 @@ def rotate_half(x):
 def apply_rotary_pos_emb(q, k, cos, sin, position_ids):
    # The first two dimensions of cos and sin are always 1, so we can `squeeze` them.
-    cos = cos.squeeze((0, 1))  # [seq_len, dim]
+    cos = cos.squeeze(1).squeeze(0)  # [seq_len, dim]
-    sin = sin.squeeze((0, 1))  # [seq_len, dim]
+    sin = sin.squeeze(1).squeeze(0)  # [seq_len, dim]
    cos = cos[position_ids].unsqueeze(1)  # [bs, 1, seq_len, dim]
    sin = sin[position_ids].unsqueeze(1)  # [bs, 1, seq_len, dim]
    q_embed = (q * cos) + (rotate_half(q) * sin)