fix mooncake store mla zero copy meta (#9678)

ae7428a8 · huangtingwei · GitHub · a3aee7c3 · ae7428a8
Unverified Commit ae7428a8 authored Aug 27, 2025 by huangtingwei Committed by GitHub Aug 27, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 2 deletions

python/sglang/srt/mem_cache/memory_pool_host.py python/sglang/srt/mem_cache/memory_pool_host.py +1 -2

No files found.
--- a/python/sglang/srt/mem_cache/memory_pool_host.py
+++ b/python/sglang/srt/mem_cache/memory_pool_host.py
@@ -705,7 +705,6 @@ class MLATokenToKVPoolHost(HostKVCache):
            raise ValueError(f"Unsupported layout: {self.layout}")

    def get_buffer_meta(self, keys, indices):
-        local_rank = get_tensor_model_parallel_rank()
        ptr_list = []
        key_list = []
        kv_buffer_data_ptr = self.kv_buffer.data_ptr()
@@ -719,7 +718,7 @@ class MLATokenToKVPoolHost(HostKVCache):
            )
            ptr_list.append(k_ptr)
            key_ = keys[index // self.page_size]
-            key_list.append(f"{key_}_{local_rank}_k")
+            key_list.append(f"{key_}_k")
        element_size = (
            self.layer_num
            * self.dtype.itemsize