added gpu b-spline basis degree computation

b5c7d334 · rusty1s · 3d2bc25c · b5c7d334 · b5c7d334
Commit b5c7d334 authored Mar 23, 2018 by rusty1s
Hide whitespace changes
Inline Side-by-side

Showing with 67 additions and 43 deletions

test/test_basis.py test/test_basis.py +7 -7

torch_spline_conv/kernel/THCBasisForward.cuh torch_spline_conv/kernel/THCBasisForward.cuh +60 -36

No files found.
--- a/test/test_basis.py
+++ b/test/test_basis.py
@@ -44,10 +44,10 @@ def test_spline_basis_gpu(tensor, i):
    expected_basis = Tensor(tensor, data[i]['expected_basis'])
    expected_index = torch.LongTensor(data[i]['expected_index'])

-    if i == 0:
-        basis, index = spline_basis_forward(degree, pseudo, kernel_size,
-                                            is_open_spline, K)
-        basis, index = basis.cpu(), index.cpu()
-        basis = [pytest.approx(x, 0.01) for x in basis.view(-1).tolist()]
-        assert basis == expected_basis.view(-1).tolist()
-        assert index.tolist() == expected_index.tolist()
+    basis, index = spline_basis_forward(degree, pseudo, kernel_size,
+                                        is_open_spline, K)
+    basis, index = basis.cpu(), index.cpu()
+    basis = [pytest.approx(x, 0.01) for x in basis.view(-1).tolist()]
+
+    assert basis == expected_basis.view(-1).tolist()
+    assert index.tolist() == expected_index.tolist()
--- a/torch_spline_conv/kernel/THCBasisForward.cuh
+++ b/torch_spline_conv/kernel/THCBasisForward.cuh
@@ -11,65 +11,89 @@
  KERNEL_D_RUN(NAME, pseudoInfo.size[1], n, basisInfo, weightIndexInfo, pseudoInfo, kernelSizeData, isOpenSplineData, K) \
 }

-template<typename Real, int M, int D>
+#define COMPUTE_SPLINE_BASIS_FORWARD(M, D, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K, CODE) { \
+  int64_t k = i % basis.size[1]; \
+  int64_t pseudoOffset = ((i / basis.size[1]) % pseudo.size[0]) * pseudo.stride[0]; \
+  int64_t d, k_mod, wi = 0, offset = K; Real b = 1, value; \
+  for (d = 0; d < D; d++) { \
+    offset /= kernelSize[d]; \
+    k_mod = k % (M + 1); \
+    k /= M + 1; \
+    value = pseudo.data[pseudoOffset + d * pseudo.stride[1]] * (kernelSize[d] - M * isOpenSpline[d]); \
+    wi += (((int64_t) value + k_mod) % kernelSize[d]) * offset; \
+    value -= floor(value); \
+    CODE \
+    b *= value; \
+  } \
+  basis.data[i] = b; \
+  weightIndex.data[i] = wi; \
+}
+
+template<typename Real, int D>
 struct SplineBasisForward {
-  static __device__ void compute(int i, const TensorInfo<Real>& basis, const TensorInfo<int64_t>& weightIndex, const TensorInfo<Real>& pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K) {
-    int64_t k = i % basis.size[1];
-    int64_t pseudoOffset = ((i / basis.size[1]) % pseudo.size[0]) * pseudo.stride[0];
-    int64_t d, k_mod, wi = 0, offset = K; Real b = 1, value;
-    for (d = 0; d < D; d++) {
-      offset /= kernelSize[d];
-      k_mod = k % (M + 1);
-      k /= M + 1;
-      value = pseudo.data[pseudoOffset + d * pseudo.stride[1]] * (kernelSize[d] - M * isOpenSpline[d]);
-      wi += (((int64_t) value + k_mod) % kernelSize[d]) * offset;
-      value -= floor(value);
+  static __device__ void linear(int i, const TensorInfo<Real>& basis, const TensorInfo<int64_t>& weightIndex, const TensorInfo<Real>& pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K) {
+    COMPUTE_SPLINE_BASIS_FORWARD(1, D, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K,
      value = 1 - value - k_mod + 2 * value * k_mod;
-      b *= value;
-    }
-    basis.data[i] = b;
-    weightIndex.data[i] = wi;
+    )
+  }
+  static __device__ void quadratic(int i, const TensorInfo<Real>& basis, const TensorInfo<int64_t>& weightIndex, const TensorInfo<Real>& pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K) {
+    COMPUTE_SPLINE_BASIS_FORWARD(2, D, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K,
+      if (k_mod == 0) value = 0.5 * value * value - value + 0.5;
+      else if (k_mod == 1) value = -value * value + value + 0.5;
+      else value = 0.5 * value * value;
+    )
+  }
+  static __device__ void cubic(int i, const TensorInfo<Real>& basis, const TensorInfo<int64_t>& weightIndex, const TensorInfo<Real>& pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K) {
+    COMPUTE_SPLINE_BASIS_FORWARD(3, D, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K,
+      if (k_mod == 0) { value = (1 - value); value = value * value * value / 6.0; }
+      else if (k_mod == 1) value = (3 * value * value * value - 6 * value * value + 4) / 6;
+      else if (k_mod == 2) value = (-3 * value * value * value + 3 * value * value + 3 * value + 1) / 6;
+      else value = value * value * value / 6;
+    )
  }
 };

-template<typename Real, int M>
-struct SplineBasisForward<Real, M, -1> {
-  static __device__ void compute(int i, const TensorInfo<Real>& basis, const TensorInfo<int64_t>& weightIndex, const TensorInfo<Real>& pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K) {
-    int64_t k = i % basis.size[1];
-    int64_t pseudoOffset = ((i / basis.size[1]) % pseudo.size[0]) * pseudo.stride[0];
-    int64_t d, k_mod, wi = 0, offset = K; Real b = 1, value;
-    for (d = 0; d < pseudo.size[1]; d++) {
-      offset /= kernelSize[d];
-      k_mod = k % (M + 1);
-      k /= M + 1;
-      value = pseudo.data[pseudoOffset + d * pseudo.stride[1]] * (kernelSize[d] - M * isOpenSpline[d]);
-      wi += (((int64_t) value + k_mod) % kernelSize[d]) * offset;
-      value -= floor(value);
+template<typename Real>
+struct SplineBasisForward<Real, -1> {
+  static __device__ void linear(int i, const TensorInfo<Real>& basis, const TensorInfo<int64_t>& weightIndex, const TensorInfo<Real>& pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K) {
+    COMPUTE_SPLINE_BASIS_FORWARD(1, pseudo.size[1], basis, weightIndex, pseudo, kernelSize, isOpenSpline, K,
      value = 1 - value - k_mod + 2 * value * k_mod;
-      b *= value;
-    }
-    basis.data[i] = b;
-    weightIndex.data[i] = wi;
+    )
+  }
+  static __device__ void quadratic(int i, const TensorInfo<Real>& basis, const TensorInfo<int64_t>& weightIndex, const TensorInfo<Real>& pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K) {
+    COMPUTE_SPLINE_BASIS_FORWARD(2, pseudo.size[1], basis, weightIndex, pseudo, kernelSize, isOpenSpline, K,
+      if (k_mod == 0) value = 0.5 * value * value - value + 0.5;
+      else if (k_mod == 1) value = -value * value + value + 0.5;
+      else value = 0.5 * value * value;
+    )
+  }
+  static __device__ void cubic(int i, const TensorInfo<Real>& basis, const TensorInfo<int64_t>& weightIndex, const TensorInfo<Real>& pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K) {
+    COMPUTE_SPLINE_BASIS_FORWARD(3, pseudo.size[1], basis, weightIndex, pseudo, kernelSize, isOpenSpline, K,
+      if (k_mod == 0) { value = (1 - value); value = value * value * value / 6.0; }
+      else if (k_mod == 1) value = (3 * value * value * value - 6 * value * value + 4) / 6;
+      else if (k_mod == 2) value = (-3 * value * value * value + 3 * value * value + 3 * value + 1) / 6;
+      else value = value * value * value / 6;
+    )
  }
 };

 template<typename Real, int D>
 __global__ void linearBasisForwardKernel(TensorInfo<Real> basis, TensorInfo<int64_t> weightIndex, TensorInfo<Real> pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K, int n) {
  KERNEL_LOOP(i, n) {
-    SplineBasisForward<Real, 1, D>::compute(i, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K);
+    SplineBasisForward<Real, D>::linear(i, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K);
  }
 }

 template<typename Real, int D>
 __global__ void quadraticBasisForwardKernel(TensorInfo<Real> basis, TensorInfo<int64_t> weightIndex, TensorInfo<Real> pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K, int n) {
  KERNEL_LOOP(i, n) {
-    SplineBasisForward<Real, 2, D>::compute(i, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K);
+    SplineBasisForward<Real, D>::quadratic(i, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K);
  }
 }

 template<typename Real, int D>
 __global__ void cubicBasisForwardKernel(TensorInfo<Real> basis, TensorInfo<int64_t> weightIndex, TensorInfo<Real> pseudo, int64_t *kernelSize, uint8_t *isOpenSpline, int K, int n) {
  KERNEL_LOOP(i, n) {
-    SplineBasisForward<Real, 3, D>::compute(i, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K);
+    SplineBasisForward<Real, D>::cubic(i, basis, weightIndex, pseudo, kernelSize, isOpenSpline, K);
  }
 }