use last index for dim_size in segment_coo

54d23137 · rusty1s · 524326d0 · 54d23137 · 54d23137
Commit 54d23137 authored Jul 16, 2020 by rusty1s
Hide whitespace changes
Inline Side-by-side

Showing with 8 additions and 3 deletions

csrc/cpu/segment_coo_cpu.cpp csrc/cpu/segment_coo_cpu.cpp +5 -2

csrc/cuda/segment_coo_cuda.cu csrc/cuda/segment_coo_cuda.cu +3 -1

No files found.
--- a/csrc/cpu/segment_coo_cpu.cpp
+++ b/csrc/cpu/segment_coo_cpu.cpp
@@ -36,8 +36,11 @@ segment_coo_cpu(torch::Tensor src, torch::Tensor index,
      sizes[dim] = dim_size.value();
    else if (index.numel() == 0)
      sizes[dim] = 0;
-    else
+    else {
-      sizes[dim] = 1 + *index.max().data_ptr<int64_t>();
+      auto tmp = index.select(dim, index.size(dim) - 1);
+      tmp = tmp.numel() > 1 ? tmp.max() : tmp;
+      sizes[dim] = 1 + *tmp.data_ptr<int64_t>();
+    }
    out = torch::empty(sizes, src.options());
  }

--- a/csrc/cuda/segment_coo_cuda.cu
+++ b/csrc/cuda/segment_coo_cuda.cu
@@ -184,7 +184,9 @@ segment_coo_cuda(torch::Tensor src, torch::Tensor index,
    else if (index.numel() == 0)
      sizes[dim] = 0;
    else {
-      auto d_size = index.max().data_ptr<int64_t>();
+      auto tmp = index.select(dim, index.size(dim) - 1);
+      tmp = tmp.numel() > 1 ? tmp.max() : tmp;
+      auto d_size = tmp.data_ptr<int64_t>();
      auto h_size = (int64_t *)malloc(sizeof(int64_t));
      cudaMemcpy(h_size, d_size, sizeof(int64_t), cudaMemcpyDeviceToHost);
      sizes[dim] = 1 + *h_size;