[Kernel] Fix deprecation function warnings squeezellm quant_cuda_kernel (#6901)

60d1c6e5 · Tyler Michael Smith · GitHub · db9e5708 · 60d1c6e5
Unverified Commit 60d1c6e5 authored Jul 29, 2024 by Tyler Michael Smith Committed by GitHub Jul 29, 2024
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

csrc/quantization/squeezellm/quant_cuda_kernel.cu csrc/quantization/squeezellm/quant_cuda_kernel.cu +2 -2

No files found.
--- a/csrc/quantization/squeezellm/quant_cuda_kernel.cu
+++ b/csrc/quantization/squeezellm/quant_cuda_kernel.cu
@@ -197,13 +197,13 @@ void squeezellm_gemm(torch::Tensor vec, torch::Tensor mat, torch::Tensor mul,
  const cudaStream_t stream = at::cuda::getCurrentCUDAStream();
  vllm::squeezellm::NUQ4MatMulKernel<<<blocks, threads, 0, stream>>>(
 #ifndef USE_ROCM
-      (half2*)vec.data<at::Half>(),
+      (half2*)vec.data_ptr<at::Half>(),
 #else
      (__half2*)vec.data_ptr<at::Half>(),
 #endif
      mat.data_ptr<int>(),
 #ifndef USE_ROCM
-      (half2*)mul.data<at::Half>(), (__half*)lookup_table.data<at::Half>(),
+      (half2*)mul.data<at::Half>(), (__half*)lookup_table.data_ptr<at::Half>(),
 #else
      (float2*)mul.data_ptr<float>(),
      (__half*)lookup_table.data_ptr<at::Half>(),