Fix rope cache key error (#1867)

d27f4bae · Roy · GitHub · 8d8c2f6f · d27f4bae
Unverified Commit d27f4bae authored Dec 01, 2023 by Roy Committed by GitHub Nov 30, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 1 deletion

vllm/model_executor/layers/rotary_embedding.py vllm/model_executor/layers/rotary_embedding.py +2 -1

No files found.
--- a/vllm/model_executor/layers/rotary_embedding.py
+++ b/vllm/model_executor/layers/rotary_embedding.py
@@ -284,9 +284,10 @@ def get_rope(
    rope_scaling: Optional[Dict[str, Any]] = None,
 ) -> RotaryEmbedding:
    key = (head_size, rotary_dim, max_position, base, is_neox_style,
-           rope_scaling)
+           tuple(rope_scaling.items()) if rope_scaling is not None else None)
    if key in _ROPE_DICT:
        return _ROPE_DICT[key]
    if rope_scaling is None:
        rotary_emb = RotaryEmbedding(head_size, rotary_dim, max_position, base,
                                     is_neox_style)