3d segmantation

1df7b845 · Benjamin Thomas Graham · f2e3800b · 1df7b845 · 1df7b845 · 1df7b845
Commit 1df7b845 authored May 14, 2018 by Benjamin Thomas Graham
20 changed files
--- a/PyTorch/setup.py
+++ b/PyTorch/setup.py
@@ -22,6 +22,7 @@ if torch.cuda.is_available():
        + '-gencode arch=compute_30,code=sm_30 '
        + '-DNVCC '
        + '-I/usr/local/cuda/include '
+        + '-I' + '/'.join(torch_dir.split('/')[:-4]) + '/include '
        + '-I' + torch_dir + '/lib/include '
        + '-I' + torch_dir + '/lib/include/TH '
        + '-I' + torch_dir + '/lib/include/THC '
@@ -43,11 +44,11 @@ if torch.cuda.is_available():
        with_cuda=True)
 else:
    r = os.system(
-        'cd sparseconvnet/SCN; g++ -fopenmp -std=c++11 -O3 -fPIC -c init.cpp -o init.cpp.o -I' +
-        torch_dir +
-        '/lib/include -I' +
-        torch_dir +
-        '/lib/include/TH -I.')
+        'cd sparseconvnet/SCN; g++ -fopenmp -std=c++11 -O3 -fPIC -c init.cpp -o init.cpp.o '
+        + '-I' + '/'.join(torch_dir.split('/')[:-4]) + '/include '
+        + '-I' + torch_dir + '/lib/include '
+        + '-I' + torch_dir + '/lib/include/TH '
+        + '-I.')
    assert r == 0
    ffi = create_extension(
        'sparseconvnet.SCN',

--- a/sparseconvnet/SCN/__init__.py
+++ b/sparseconvnet/SCN/__init__.py
+
+from torch.utils.ffi import _wrap_function
+from ._SCN import lib as _lib, ffi as _ffi
+
+__all__ = []
+def _import_symbols(locals):
+    for symbol in dir(_lib):
+        fn = getattr(_lib, symbol)
+        if callable(fn):
+            locals[symbol] = _wrap_function(fn, _ffi)
+        else:
+            locals[symbol] = fn
+        __all__.append(symbol)
+
+_import_symbols(locals())
--- a/PyTorch/sparseconvnet/SCN/drawCurve.cpp
+++ b/PyTorch/sparseconvnet/SCN/drawCurve.cpp
--- a/PyTorch/sparseconvnet/SCN/generic/32bits.h
+++ b/PyTorch/sparseconvnet/SCN/generic/32bits.h
@@ -33,7 +33,7 @@ template <uInt dimension> Point<dimension> LongTensorToPoint(THLongTensor *t) {
  return p;
 }
 template <uInt dimension>
-Point<2*dimension> TwoLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1) {
+Point<2 * dimension> TwoLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1) {
  Point<2 * dimension> p;
  long *td;
  td = THLongTensor_data(t0);
@@ -45,7 +45,7 @@ Point<2*dimension> TwoLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1) {
  return p;
 }
 template <uInt dimension>
-Point<3*dimension> ThreeLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1,
+Point<3 * dimension> ThreeLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1,
                                             THLongTensor *t2) {
  Point<3 * dimension> p;
  long *td;
@@ -74,6 +74,4 @@ template <uInt dimension> struct IntArrayHash {
 };

 #define THCITensor THCudaIntTensor
-#define THCITensor_nElement THCudaIntTensor_nElement
-#define THCITensor_resize1d THCudaIntTensor_resize1d
-#define THCITensor_data THCudaIntTensor_data
+#define THCITensor_(NAME) TH_CONCAT_3(THCITensor, _, NAME)
--- a/PyTorch/sparseconvnet/SCN/generic/64bits.h
+++ b/PyTorch/sparseconvnet/SCN/generic/64bits.h
@@ -33,7 +33,7 @@ template <uInt dimension> Point<dimension> LongTensorToPoint(THLongTensor *t) {
  return p;
 }
 template <uInt dimension>
-Point<2*dimension> TwoLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1) {
+Point<2 * dimension> TwoLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1) {
  Point<2 * dimension> p;
  long *td;
  td = THLongTensor_data(t0);
@@ -45,7 +45,7 @@ Point<2*dimension> TwoLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1) {
  return p;
 }
 template <uInt dimension>
-Point<3*dimension> ThreeLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1,
+Point<3 * dimension> ThreeLongTensorsToPoint(THLongTensor *t0, THLongTensor *t1,
                                             THLongTensor *t2) {
  Point<3 * dimension> p;
  long *td;
@@ -74,6 +74,4 @@ template <uInt dimension> struct IntArrayHash {
 };

 #define THCITensor THCudaLongTensor
-#define THCITensor_nElement THCudaLongTensor_nElement
-#define THCITensor_resize1d THCudaLongTensor_resize1d
-#define THCITensor_data THCudaLongTensor_data
+#define THCITensor_(NAME) TH_CONCAT_3(THCITensor, _, NAME)
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/ActivePooling.cpp
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/ActivePooling.cpp
@@ -11,7 +11,7 @@

 extern "C" void scn_DR_(ActivePooling_updateOutput)(
    THLongTensor *inputSize, void **m, THTensor *input_features,
-    THTensor *output_features, void *rulesBuffer, bool average) {
+    THTensor *output_features,  bool average) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  uInt nPlanes = input_features->size[1];
@@ -27,7 +27,7 @@ extern "C" void scn_DR_(ActivePooling_updateOutput)(
 }
 extern "C" void scn_DR_(ActivePooling_updateGradInput)(
    THLongTensor *inputSize, void **m, THTensor *input_features,
-    THTensor *d_input_features, THTensor *d_output_features, void *rulesBuffer,
+    THTensor *d_input_features, THTensor *d_output_features,
    bool average) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)

--- a/PyTorch/sparseconvnet/SCN/generic/CPU/ActivePooling.h
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/ActivePooling.h
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/AffineReluTrivialConvolution.cpp
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/AffineReluTrivialConvolution.cpp
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/AffineReluTrivialConvolution.h
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/AffineReluTrivialConvolution.h
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/AveragePooling.cpp
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/AveragePooling.cpp
@@ -12,7 +12,7 @@
 extern "C" void scn_DR_(AveragePooling_updateOutput)(
    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *poolSize,
    THLongTensor *poolStride, void **m, THTensor *input_features,
-    THTensor *output_features, long nFeaturesToDrop, void *rulesBuffer) {
+    THTensor *output_features, long nFeaturesToDrop) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  uInt nPlanes = input_features->size[1] - nFeaturesToDrop;
@@ -37,7 +37,7 @@ extern "C" void scn_DR_(AveragePooling_updateGradInput)(
    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *poolSize,
    THLongTensor *poolStride, void **m, THTensor *input_features,
    THTensor *d_input_features, THTensor *d_output_features,
-    long nFeaturesToDrop, void *rulesBuffer) {
+    long nFeaturesToDrop) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  uInt nPlanes = input_features->size[1] - nFeaturesToDrop;

--- a/PyTorch/sparseconvnet/SCN/generic/CPU/AveragePooling.h
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/AveragePooling.h
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/BatchNormalization.cpp
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/BatchNormalization.cpp
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/BatchNormalization.h
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/BatchNormalization.h
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/BatchwiseMultiplicativeDropout.cpp
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/BatchwiseMultiplicativeDropout.cpp
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/Convolution.cpp
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/Convolution.cpp
@@ -13,7 +13,7 @@ extern "C" double scn_DR_(Convolution_updateOutput)(
    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *filterSize,
    THLongTensor *filterStride, void **m, THTensor *input_features,
    THTensor *output_features, THTensor *weight, THTensor *bias,
-    long filterVolume, void *rulesBuffer) {
+    long filterVolume) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto _rules =
@@ -43,8 +43,7 @@ extern "C" void scn_DR_(Convolution_backward)(
    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *filterSize,
    THLongTensor *filterStride, void **m, THTensor *input_features,
    THTensor *d_input_features, THTensor *d_output_features, THTensor *weight,
-    THTensor *d_weight, THTensor *d_bias, long filterVolume,
-    void *rulesBuffer) {
+    THTensor *d_weight, THTensor *d_bias, long filterVolume) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto _rules =
@@ -71,7 +70,7 @@ extern "C" void scn_DR_(Convolution_backward)(
 extern "C" double scn_DR_(SubmanifoldConvolution_updateOutput)(
    THLongTensor *inputSize, THLongTensor *filterSize, void **m,
    THTensor *input_features, THTensor *output_features, THTensor *weight,
-    THTensor *bias, long filterVolume, void *rulesBuffer) {
+    THTensor *bias, long filterVolume) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto _rules = _m.getSubmanifoldRuleBook(inputSize, filterSize, true);
@@ -101,7 +100,7 @@ extern "C" void scn_DR_(SubmanifoldConvolution_backward)(
    THLongTensor *inputSize, THLongTensor *filterSize, void **m,
    THTensor *input_features, THTensor *d_input_features,
    THTensor *d_output_features, THTensor *weight, THTensor *d_weight,
-    THTensor *d_bias, long filterVolume, void *rulesBuffer) {
+    THTensor *d_bias, long filterVolume) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto _rules = _m.getSubmanifoldRuleBook(inputSize, filterSize, true);
@@ -123,4 +122,122 @@ extern "C" void scn_DR_(SubmanifoldConvolution_backward)(
                             nActive, THBlas_(gemm));
  }
 }
+extern "C" double scn_DR_(FullConvolution_updateOutput)(
+    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *filterSize,
+    THLongTensor *filterStride, void **mIn, void **mOut,
+    THTensor *input_features, THTensor *output_features, THTensor *weight,
+    THTensor *bias, long filterVolume) {
+  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, mIn)
+  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, mOut)
+  auto _rules = _mIn.getFullConvolutionRuleBook(
+      inputSize, outputSize, filterSize, filterStride, _mOut);
+  uInt nActive = _mOut.getNActive(outputSize);
+  THTensor_(resize2d)(output_features, nActive, weight->size[1]);
+  if (not bias)
+    THTensor_(zero)(output_features);
+
+  double flops = 0;
+  if (nActive) {
+    auto iF = THTensor_(data)(input_features);
+    auto oF = THTensor_(data)(output_features);
+    auto ip = input_features->size[1];
+    auto op = output_features->size[1];
+    auto w = THTensor_(data)(weight);
+    auto b = THOptionalTensorData(bias);
+    Convolution_ForwardPass(iF, ip, ip, oF, op, op, w, b, _rules, nActive,
+                            THBlas_(gemm));
+    for (auto &r : _rules)
+      flops += r.size() / 2 * ip * op;
+  }
+  return flops;
+}
+
+extern "C" void scn_DR_(FullConvolution_backward)(
+    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *filterSize,
+    THLongTensor *filterStride, void **mIn, void **mOut,
+    THTensor *input_features, THTensor *d_input_features,
+    THTensor *d_output_features, THTensor *weight, THTensor *d_weight,
+    THTensor *d_bias, long filterVolume) {
+
+  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, mIn)
+  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, mOut)
+  auto _rules = _mIn.getFullConvolutionRuleBook(
+      inputSize, outputSize, filterSize, filterStride, _mOut);
+  uInt nActive = _mOut.getNActive(outputSize);
+  THTensor_(resizeAs)(d_input_features, input_features);
+  THTensor_(zero)(d_input_features);
+
+  if (nActive) {
+    auto iF = THTensor_(data)(input_features);
+    auto diF = THTensor_(data)(d_input_features);
+    auto doF = THTensor_(data)(d_output_features);
+    auto ip = input_features->size[1];
+    auto op = d_output_features->size[1];
+    auto w = THTensor_(data)(weight);
+    auto dw = THTensor_(data)(d_weight);
+    auto db = THOptionalTensorData(d_bias);
+
+    Convolution_BackwardPass(iF, diF, ip, ip, doF, op, op, w, dw, db, _rules,
+                             nActive, THBlas_(gemm));
+  }
+}
+
+extern "C" double scn_DR_(RandomizedStrideConvolution_updateOutput)(
+    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *filterSize,
+    THLongTensor *filterStride, void **m, THTensor *input_features,
+    THTensor *output_features, THTensor *weight, THTensor *bias,
+    long filterVolume) {
+  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
+  auto _rules =
+      _m.getRandomizedStrideRuleBook(inputSize, outputSize, filterSize, filterStride, true);
+  uInt nActive = _m.getNActive(outputSize);
+  THTensor_(resize2d)(output_features, nActive, weight->size[1]);
+  if (not bias)
+    THTensor_(zero)(output_features);
+
+  double flops = 0;
+  if (nActive) {
+    auto iF = THTensor_(data)(input_features);
+    auto oF = THTensor_(data)(output_features);
+    auto ip = input_features->size[1];
+    auto op = output_features->size[1];
+    auto w = THTensor_(data)(weight);
+    auto b = THOptionalTensorData(bias);
+    Convolution_ForwardPass(iF, ip, ip, oF, op, op, w, b, _rules, nActive,
+                            THBlas_(gemm));
+    for (auto &r : _rules)
+      flops += r.size() / 2 * ip * op;
+  }
+  return flops;
+}
+
+extern "C" void scn_DR_(RandomizedStrideConvolution_backward)(
+    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *filterSize,
+    THLongTensor *filterStride, void **m, THTensor *input_features,
+    THTensor *d_input_features, THTensor *d_output_features, THTensor *weight,
+    THTensor *d_weight, THTensor *d_bias, long filterVolume) {
+
+  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
+  auto _rules =
+      _m.getRandomizedStrideRuleBook(inputSize, outputSize, filterSize, filterStride, true);
+  uInt nActive = _m.getNActive(outputSize);
+  THTensor_(resizeAs)(d_input_features, input_features);
+  THTensor_(zero)(d_input_features);
+
+  if (nActive) {
+    auto iF = THTensor_(data)(input_features);
+    auto diF = THTensor_(data)(d_input_features);
+    auto doF = THTensor_(data)(d_output_features);
+    auto ip = input_features->size[1];
+    auto op = d_output_features->size[1];
+    auto w = THTensor_(data)(weight);
+    auto dw = THTensor_(data)(d_weight);
+    auto db = THOptionalTensorData(d_bias);
+
+    Convolution_BackwardPass(iF, diF, ip, ip, doF, op, op, w, dw, db, _rules,
+                             nActive, THBlas_(gemm));
+  }
+}
+
+
 #endif
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/Convolution.h
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/Convolution.h
@@ -12,9 +12,9 @@

 template <typename T>
 void Convolution_ForwardPass(
-    T *input_features, uInt input_nPlanes, uInt input_nPLANES, T *output_features,
-    uInt output_nPlanes, uInt output_nPLANES, T *weight, T *bias, RuleBook &rules,
-    uInt output_nActive,
+    T *input_features, uInt input_nPlanes, uInt input_nPLANES,
+    T *output_features, uInt output_nPlanes, uInt output_nPLANES, T *weight,
+    T *bias, RuleBook &rules, uInt output_nActive,
    void (*gemm)(char transa, char transb, long m, long n, long k, T alpha,
                 T *a, long lda, T *b, long ldb, T beta, T *c, long ldc)) {

@@ -28,10 +28,11 @@ void Convolution_ForwardPass(
    uInt nHot = r.size() / 2;
    input_buffer.resize(nHot * input_nPlanes);
    output_buffer.resize(nHot * output_nPlanes);
-    for (uInt row = 0; row < nHot; row++)
+    for (uInt row = 0; row < nHot; row++) {
      std::memcpy(&input_buffer[row * input_nPlanes],
                  input_features + r[2 * row] * input_nPLANES,
                  sizeof(T) * input_nPlanes);
+    }
    // Do GEMM (note: gemm assumes column-major matrices)
    // input_buffer    is l*m (row-major)
    // weight          is m*r (row-major)
@@ -59,9 +60,10 @@ void Convolution_ForwardPass(

 template <typename T>
 void Convolution_BackwardPass(
-    T *input_features, T *d_input_features, uInt input_nPlanes,uInt input_nPLANES,
-    T *d_output_features, uInt output_nPlanes,uInt output_nPLANES, T *weight, T *d_weight,
-    T *d_bias, RuleBook &rules, uInt output_nActive,
+    T *input_features, T *d_input_features, uInt input_nPlanes,
+    uInt input_nPLANES, T *d_output_features, uInt output_nPlanes,
+    uInt output_nPLANES, T *weight, T *d_weight, T *d_bias, RuleBook &rules,
+    uInt output_nActive,
    void (*gemm)(char transa, char transb, long m, long n, long k, T alpha,
                 T *a, long lda, T *b, long ldb, T beta, T *c, long ldc)) {

@@ -124,4 +126,30 @@ void Convolution_BackwardPass(
    d_weight += input_nPlanes * output_nPlanes;
  }
 }
+
+// template <typename T>
+// void Convolution_ForwardPass(
+//     T *input_features, uInt input_nPlanes, uInt input_nPLANES,
+//     T *output_features, uInt output_nPlanes, uInt output_nPLANES, T *weight,
+//     T *bias, RuleBook &rules, uInt output_nActive,
+//     void (*gemm)(char transa, char transb, long m, long n, long k, T alpha,
+//                  T *a, long lda, T *b, long ldb, T beta, T *c, long ldc)) {
+
+//   if (bias != nullptr) // Set bias
+//     for (uInt row = 0; row < output_nActive; row++)
+//       for (uInt column = 0; column < output_nPlanes; column++)
+//         output_features[row * output_nPLANES + column] = bias[column];
+
+//   for (auto &r : rules) {
+//     uInt nHot = r.size() / 2;
+//     for (uInt row = 0; row < nHot; row++) {
+//       T *inp = &input_features[r[2 * row] * input_nPLANES];
+//       T *out = &output_features[r[2 * row + 1] * output_nPLANES];
+//       for (uInt i = 0; i < input_nPlanes; i++)
+//         for (uInt j = 0; j < output_nPlanes; j++)
+//           out[j] += inp[i] * weight[i * input_nPlanes + j];
+//     }
+//     weight += input_nPlanes * output_nPlanes;
+//   }
+// }
 #endif /* CPU_CONVOLUTION_H */
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/Deconvolution.cpp
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/Deconvolution.cpp
@@ -13,7 +13,7 @@ extern "C" double scn_DR_(Deconvolution_updateOutput)(
    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *filterSize,
    THLongTensor *filterStride, void **m, THTensor *input_features,
    THTensor *output_features, THTensor *weight, THTensor *bias,
-    long filterVolume, void *rulesBuffer) {
+    long filterVolume) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto _rules =
@@ -42,8 +42,7 @@ extern "C" void scn_DR_(Deconvolution_backward)(
    THLongTensor *inputSize, THLongTensor *outputSize, THLongTensor *filterSize,
    THLongTensor *filterStride, void **m, THTensor *input_features,
    THTensor *d_input_features, THTensor *d_output_features, THTensor *weight,
-    THTensor *d_weight, THTensor *d_bias, long filterVolume,
-    void *rulesBuffer) {
+    THTensor *d_weight, THTensor *d_bias, long filterVolume) {

  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto _rules =

--- a/PyTorch/sparseconvnet/SCN/generic/CPU/Deconvolution.h
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/Deconvolution.h
--- a/PyTorch/sparseconvnet/SCN/generic/CPU/InputLayer.cpp
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/InputLayer.cpp
@@ -5,47 +5,96 @@
 // LICENSE file in the root directory of this source tree.

 #ifndef TH_GENERIC_FILE_
-#define TH_GENERIC_FILE_ "generic/CPU/InputLayer.cpp"
+#define TH_GENERIC_FILE_ "generic/CPU/IOLayers.cpp"
 #else
-#include "InputLayer.h"
+#include "IOLayers.h"

 extern "C" void scn_DR_(InputLayer_updateOutput)(
    void **m, THLongTensor *spatialSize, THLongTensor *input_coords,
    THTensor *input_features, THTensor *output_features, long batchSize,
-    long mode, void *rulesBuffer) {
+    long mode) {
  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  _m.inputLayer(spatialSize, input_coords, batchSize, mode);
  auto nPlanes = input_features->size[1];
  auto &rules = _m.inputLayerRuleBook;
  auto maxActive = rules[0][1];
  auto nRows = rules[0][3];
+  if (mode == 0) {
+    THTensor_(resizeAs)(output_features, input_features);
+    THTensor_(copy)(output_features, input_features);
+  } else {
    THTensor_(resize2d)(output_features, *_m.inputNActive, nPlanes);
    THTensor_(zero)(output_features);
    InputLayer_ForwardPass<real>(THTensor_(data)(input_features),
                                 THTensor_(data)(output_features), nRows,
                                 maxActive, nPlanes, &rules[1][0], mode == 4);
+  }
 }
 extern "C" void scn_DR_(InputLayer_updateGradInput)(void **m,
                                                    THTensor *d_input_features,
-                                                    THTensor *d_output_features,
-                                                    void *rulesBuffer) {
+                                                    THTensor *d_output_features) {
  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto &rules = _m.inputLayerRuleBook;
  auto nPlanes = d_output_features->size[1];
-  THTensor_(resize2d)(d_input_features, rules[0][2], nPlanes);
-  THTensor_(zero)(d_input_features);
  auto mode = rules[0][0];
  auto maxActive = rules[0][1];
  auto nRows = rules[0][3];
+  if (mode == 0) {
+    THTensor_(resizeAs)(d_input_features, d_output_features);
+    THTensor_(copy)(d_input_features, d_output_features);
+  } else {
+    THTensor_(resize2d)(d_input_features, rules[0][2], nPlanes);
+    THTensor_(zero)(d_input_features);
    InputLayer_BackwardPass<real>(THTensor_(data)(d_input_features),
                                  THTensor_(data)(d_output_features), nRows,
                                  maxActive, nPlanes, &rules[1][0], mode == 4);
+  }
+}
+
+extern "C" void scn_DR_(OutputLayer_updateOutput)(void **m,
+                                                  THTensor *input_features,
+                                                  THTensor *output_features) {
+  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
+  auto &rules = _m.inputLayerRuleBook;
+  auto nPlanes = input_features->size[1];
+  auto mode = rules[0][0];
+  auto maxActive = rules[0][1];
+  auto nRows = rules[0][3];
+  if (mode == 0) {
+    THTensor_(resizeAs)(output_features, input_features);
+    THTensor_(copy)(output_features, input_features);
+  } else {
+    THTensor_(resize2d)(output_features, rules[0][2], nPlanes);
+    THTensor_(zero)(output_features);
+    InputLayer_BackwardPass<real>(THTensor_(data)(output_features),
+                                  THTensor_(data)(input_features), nRows,
+                                  maxActive, nPlanes, &rules[1][0], false);
+  }
+}
+extern "C" void
+scn_DR_(OutputLayer_updateGradInput)(void **m, THTensor *d_input_features,
+                                     THTensor *d_output_features) {
+  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
+  auto &rules = _m.inputLayerRuleBook;
+  auto nPlanes = d_output_features->size[1];
+  auto mode = rules[0][0];
+  auto maxActive = rules[0][1];
+  auto nRows = rules[0][3];
+  if (mode == 0) {
+    THTensor_(resizeAs)(d_input_features, d_output_features);
+    THTensor_(copy)(d_input_features, d_output_features);
+  } else {
+    THTensor_(resize2d)(d_input_features, nRows, nPlanes);
+    THTensor_(zero)(d_input_features);
+    InputLayer_ForwardPass<real>(THTensor_(data)(d_output_features),
+                                 THTensor_(data)(d_input_features), nRows,
+                                 maxActive, nPlanes, &rules[1][0], false);
+  }
 }

 extern "C" void scn_DR_(BLInputLayer_updateOutput)(
    void **m, THLongTensor *spatialSize, THLongTensor *input_coords,
-    THTensor *input_features, THTensor *output_features, long mode,
-    void *rulesBuffer) {
+    THTensor *input_features, THTensor *output_features, long mode) {
  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  _m.blLayer(spatialSize, input_coords, mode);
  auto nPlanes = input_features->size[2];
@@ -66,8 +115,7 @@ extern "C" void scn_DR_(BLInputLayer_updateOutput)(
 }
 extern "C" void
 scn_DR_(BLInputLayer_updateGradInput)(void **m, THTensor *d_input_features,
-                                      THTensor *d_output_features,
-                                      void *rulesBuffer) {
+                                      THTensor *d_output_features) {
  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto &rules = _m.blLayerRuleBook;
  auto nPlanes = d_output_features->size[1];
@@ -90,8 +138,7 @@ scn_DR_(BLInputLayer_updateGradInput)(void **m, THTensor *d_input_features,

 extern "C" void scn_DR_(BLOutputLayer_updateOutput)(void **m,
                                                    THTensor *input_features,
-                                                    THTensor *output_features,
-                                                    void *rulesBuffer) {
+                                                    THTensor *output_features) {
  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto &rules = _m.blLayerRuleBook;
  auto nPlanes = input_features->size[1];
@@ -112,8 +159,7 @@ extern "C" void scn_DR_(BLOutputLayer_updateOutput)(void **m,
 }
 extern "C" void
 scn_DR_(BLOutputLayer_updateGradInput)(void **m, THTensor *d_input_features,
-                                       THTensor *d_output_features,
-                                       void *rulesBuffer) {
+                                       THTensor *d_output_features) {
  SCN_INITIALIZE_AND_REFERENCE(Metadata<Dimension>, m)
  auto &rules = _m.blLayerRuleBook;
  auto nPlanes = d_output_features->size[2];

--- a/PyTorch/sparseconvnet/SCN/generic/CPU/InputLayer.h
+++ b/PyTorch/sparseconvnet/SCN/generic/CPU/InputLayer.h
@@ -4,8 +4,8 @@
 // This source code is licensed under the license found in the
 // LICENSE file in the root directory of this source tree.

-#ifndef CPU_INPUTLAYER_H
-#define CPU_INPUTLAYER_H
+#ifndef CPU_IOLAYERS_H
+#define CPU_IOLAYERS_H
 #include "../SparseConvNet.h"
 #include <cstring>

@@ -44,4 +44,4 @@ void InputLayer_BackwardPass(T *d_input_features, T *d_output_features,
    rules += 1 + maxActive;
  }
 }
-#endif /* CPU_INPUTLAYER_H */
+#endif /* CPU_IOLAYERS_H */