use bool mask

b56c2359 · rusty1s · 1c4fdfe2 · b56c2359
Commit b56c2359 authored Oct 14, 2019 by rusty1s
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 4 deletions

cuda/unique_kernel.cu cuda/unique_kernel.cu +4 -4

No files found.
--- a/cuda/unique_kernel.cu
+++ b/cuda/unique_kernel.cu
@@ -6,13 +6,13 @@
 #define BLOCKS(N) (N + THREADS - 1) / THREADS

 template <typename scalar_t>
-__global__ void unique_cuda_kernel(scalar_t *__restrict__ src, uint8_t *mask,
+__global__ void unique_cuda_kernel(scalar_t *__restrict__ src, bool *mask,
                                   size_t numel) {
  const size_t index = blockIdx.x * blockDim.x + threadIdx.x;
  const size_t stride = blockDim.x * gridDim.x;
  for (ptrdiff_t i = index; i < numel; i += stride) {
    if (i == 0 || src[i] != src[i - 1]) {
-      mask[i] = 1;
+      mask[i] = true;
    }
  }
 }
@@ -22,10 +22,10 @@ std::tuple<at::Tensor, at::Tensor> unique_cuda(at::Tensor src) {
  at::Tensor perm;
  std::tie(src, perm) = src.sort();

-  auto mask = at::zeros(src.numel(), src.options().dtype(at::kByte));
+  auto mask = at::zeros(src.numel(), src.options().dtype(at::kBool));
  AT_DISPATCH_ALL_TYPES(src.scalar_type(), "grid_cuda_kernel", [&] {
    unique_cuda_kernel<scalar_t><<<BLOCKS(src.numel()), THREADS>>>(
-        src.DATA_PTR<scalar_t>(), mask.DATA_PTR<uint8_t>(), src.numel());
+        src.DATA_PTR<scalar_t>(), mask.DATA_PTR<bool>(), src.numel());
  });

  src = src.masked_select(mask);