refactor

a21b0d27 · Chao Liu · 6790b8f3 · a21b0d27 · a21b0d27 · a21b0d27
Commit a21b0d27 authored Nov 20, 2018 by Chao Liu
5 changed files
--- a/driver/conv.cu
+++ b/driver/conv.cu
@@ -178,7 +178,7 @@ int main()

    for(int i = 0; i < 20; ++i)
    {
-        device_direct_convolution_2(in_desc, in, wei_desc, wei, out_desc, out_device);
+        device_direct_convolution_1(in_desc, in, wei_desc, wei, out_desc, out_device);
    }

 #if 0

--- a/driver/device_direct_convolution_1.cuh
+++ b/driver/device_direct_convolution_1.cuh
@@ -55,7 +55,7 @@ void device_direct_convolution_1(
    cudaEventCreate(&start);
    cudaEventRecord(start, 0);

-    gridwise_convolution<T,
+    gridwise_direct_convolution_1<T,
                                  InDesc,
                                  WeiDesc,
                                  OutDesc,

--- a/driver/device_direct_convolution_2.cuh
+++ b/driver/device_direct_convolution_2.cuh
@@ -59,7 +59,7 @@ void device_direct_convolution_2(
    cudaEventCreate(&start);
    cudaEventRecord(start, 0);

-    gridwise_convolution<T,
+    gridwise_direct_convolution_2<T,
                                  InDesc,
                                  WeiDesc,
                                  OutDesc,

--- a/src/include/gridwise_direct_convolution_1.cuh
+++ b/src/include/gridwise_direct_convolution_1.cuh
@@ -20,7 +20,7 @@ template <class TFloat,
          unsigned NBlockOpLen3,
          unsigned BlockSize,
          unsigned GridSize>
-__global__ void gridwise_convolution(InGlobalDesc,
+__global__ void gridwise_direct_convolution_1(InGlobalDesc,
                                              TFloat* const __restrict__ p_in_global,
                                              WeiGlobalDesc,
                                              TFloat* const __restrict__ p_wei_global,

--- a/src/include/gridwise_direct_convolution_2.cuh
+++ b/src/include/gridwise_direct_convolution_2.cuh
@@ -25,7 +25,7 @@ template <class TFloat,
          unsigned NBlockOpLen3,
          unsigned BlockSize,
          unsigned GridSize>
-__global__ void gridwise_convolution(InGlobalDesc,
+__global__ void gridwise_direct_convolution_2(InGlobalDesc,
                                              TFloat* const __restrict__ p_in_global,
                                              WeiGlobalDesc,
                                              TFloat* const __restrict__ p_wei_global,