new try

642d548f · rusty1s · fbd14a95 · 642d548f · 642d548f · 642d548f
Commit 642d548f authored May 02, 2018 by rusty1s
13 changed files
--- a/aten/cluster.py
+++ b/aten/cluster.py
@@ -12,7 +12,8 @@ def grid(pos, size, start=None, end=None):
 def graclus(row, col, num_nodes):
-    return cluster_cpu.graclus(row, col, num_nodes)
+    lib = cluster_cuda if pos.is_cuda else cluster_cpu
+    return lib.graclus(row, col, num_nodes)
 device = torch.device('cuda')
@@ -23,10 +24,11 @@ print('size', size.tolist())
 cluster = grid(pos, size)
 print('result', cluster.tolist(), cluster.dtype, cluster.device)
-row = torch.tensor([0, 0, 1, 1, 1, 2, 2, 2, 3, 3])
-col = torch.tensor([1, 2, 0, 2, 3, 0, 1, 3, 1, 2])
-print(row)
-print(col)
 print('-----------------')
+row = torch.tensor([0, 0, 1, 1, 1, 2, 2, 2, 3, 3], device=device)
+col = torch.tensor([1, 2, 0, 2, 3, 0, 1, 3, 1, 2], device=device)
+print('row', row.tolist())
+print('col', col.tolist())
 cluster = graclus(row, col, 4)
-print(cluster)
+print('result', cluster.tolist(), cluster.dtype, cluster.device)
--- a/aten/cpu/graclus.cpp
+++ b/aten/cpu/graclus.cpp
@@ -7,9 +7,9 @@
 at::Tensor graclus(at::Tensor row, at::Tensor col, int num_nodes) {
  std::tie(row, col) = remove_self_loops(row, col);
  std::tie(row, col) = randperm(row, col, num_nodes);
+  auto deg = degree(row, num_nodes, row.type().scalarType());
  auto cluster = at::full(row.type(), {num_nodes}, -1);
-  auto deg = degree(row, num_nodes, row.type().scalarType());
  auto *row_data = row.data<int64_t>();
  auto *col_data = col.data<int64_t>();

--- a/aten/cuda/cluster.cpp
+++ b/aten/cuda/cluster.cpp
 #include <torch/torch.h>
-at::Tensor grid_cuda(at::Tensor pos, at::Tensor size, at::Tensor start,
-                     at::Tensor end);
 #define CHECK_CUDA(x) AT_ASSERT(x.type().is_cuda(), #x " must be a CUDA tensor")
-at::Tensor grid(at::Tensor pos, at::Tensor size, at::Tensor start,
+#include "graclus.cpp"
-                at::Tensor end) {
+#include "grid.cpp"
-  CHECK_CUDA(pos);
-  CHECK_CUDA(size);
-  CHECK_CUDA(start);
-  CHECK_CUDA(end);
-  return grid_cuda(pos, size, start, end);
-}
 PYBIND11_MODULE(TORCH_EXTENSION_NAME, m) {
+  m.def("graclus", &graclus, "Graclus (CUDA)");
  m.def("grid", &grid, "Grid (CUDA)");
 }
--- a/aten/cuda/graclus.cpp
+++ b/aten/cuda/graclus.cpp
+#include <torch/torch.h>
+#include "../include/degree.cpp"
+#include "../include/loop.cpp"
+at::Tensor graclus(at::Tensor row, at::Tensor col, int num_nodes) {
+  CHECK_CUDA(row);
+  CHECK_CUDA(col);
+  std::tie(row, col) = remove_self_loops(row, col);
+  auto deg = degree(row, num_nodes, row.type().scalarType());
+  return deg;
+}
--- a/aten/cuda/grid.cpp
+++ b/aten/cuda/grid.cpp
+#include <torch/torch.h>
+at::Tensor grid_cuda(at::Tensor pos, at::Tensor size, at::Tensor start,
+                     at::Tensor end);
+at::Tensor grid(at::Tensor pos, at::Tensor size, at::Tensor start,
+                at::Tensor end) {
+  CHECK_CUDA(pos);
+  CHECK_CUDA(size);
+  CHECK_CUDA(start);
+  CHECK_CUDA(end);
+  return grid_cuda(pos, size, start, end);
+}
--- a/aten/cuda/cluster_kernel.cu
+++ b/aten/cuda/cluster_kernel.cu
--- a/aten/include/degree.cpp
+++ b/aten/include/degree.cpp
-#include "degree.h"
+#ifndef DEGREE_INC
+#define DEGREE_INC
 #include <torch/torch.h>
@@ -8,3 +9,5 @@ inline at::Tensor degree(at::Tensor index, int num_nodes,
  auto one = at::full(zero.type(), {index.size(0)}, 1);
  return zero.scatter_add_(0, index, one);
 }
+#endif // DEGREE_INC
--- a/aten/include/degree.h
+++ b/aten/include/degree.h
-#ifndef DEGREE_INC
-#define DEGREE_INC
-#include <torch/torch.h>
-inline at::Tensor degree(at::Tensor index, int num_nodes,
-                         at::ScalarType scalar_type);
-#endif // DEGREE_INC
--- a/aten/include/loop.cpp
+++ b/aten/include/loop.cpp
-#include "loop.h"
+#ifndef LOOP_INC
+#define LOOP_INC
 #include <torch/torch.h>
@@ -7,3 +8,5 @@ inline std::tuple<at::Tensor, at::Tensor> remove_self_loops(at::Tensor row,
  auto mask = row != col;
  return {row.masked_select(mask), col.masked_select(mask)};
 }
+#endif // LOOP_INC
--- a/aten/include/loop.h
+++ b/aten/include/loop.h
-#ifndef LOOP_INC
-#define LOOP_INC
-#include <torch/torch.h>
-inline std::tuple<at::Tensor, at::Tensor> remove_self_loops(at::Tensor row,
-                                                            at::Tensor col);
-#endif // LOOP_INC
--- a/aten/include/perm.cpp
+++ b/aten/include/perm.cpp
-#include "perm.h"
+#ifndef PERM_INC
+#define PERM_INC
 #include <torch/torch.h>
@@ -22,3 +23,5 @@ randperm(at::Tensor row, at::Tensor col, int num_nodes) {
  return {row, col};
 }
+#endif // PERM_INC
--- a/aten/include/perm.h
+++ b/aten/include/perm.h
-#ifndef PERM_INC
-#define PERM_INC
-#include <torch/torch.h>
-inline std::tuple<at::Tensor, at::Tensor>
-randperm(at::Tensor row, at::Tensor col, int num_nodes);
-#endif // PERM_INC
--- a/aten/setup.py
+++ b/aten/setup.py
-import torch
+import glob
 from setuptools import setup
+import torch.cuda
 from torch.utils.cpp_extension import CppExtension, CUDAExtension
-ext_modules = [CppExtension(name='cluster_cpu', sources=['cpu/cluster.cpp'])]
+ext_modules = [CppExtension('cluster_cpu', ['cpu/cluster.cpp'])]
 if torch.cuda.is_available():
    ext_modules += [
-        CUDAExtension(
+        CUDAExtension('cluster_cuda',
-            name='cluster_cuda',
+                      ['cuda/cluster.cpp'] + glob.glob('cuda/*.cu'))
-            sources=['cuda/cluster.cpp', 'cuda/cluster_kernel.cu'])
    ]
 setup(