[Bugfix][Kernel][CPU] Fix num_tokens in CPU rotary embedding kernel (#14667)

Signed-off-by: Thien Tran <gau.nernst@yahoo.com.sg>

[Bugfix][Kernel][CPU] Fix num_tokens in CPU rotary embedding kernel (#14667)
Signed-off-by: Thien Tran <gau.nernst@yahoo.com.sg>
27b50f1f · Thien Tran · GitHub · 9532c498 · 27b50f1f
Unverified Commit 27b50f1f authored Mar 14, 2025 by Thien Tran Committed by GitHub Mar 13, 2025
Show whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

csrc/cpu/pos_encoding.cpp csrc/cpu/pos_encoding.cpp +1 -1

No files found.
--- a/csrc/cpu/pos_encoding.cpp
+++ b/csrc/cpu/pos_encoding.cpp
@@ -170,7 +170,7 @@ void rotary_embedding_gptj_impl(
 void rotary_embedding(torch::Tensor& positions, torch::Tensor& query,
                      torch::Tensor& key, int64_t head_size,
                      torch::Tensor& cos_sin_cache, bool is_neox) {
-  int num_tokens = query.numel() / query.size(-1);
+  int num_tokens = positions.numel();
  int rot_dim = cos_sin_cache.size(1);
  int num_heads = query.size(-1) / head_size;
  int num_kv_heads = key.size(-1) / head_size;