cuFFT execution error checking (#2926)

* Adds cuFFT error checking for execution * Removes tabs Co-authored-by: David Clark <daclark@nvidia.com>

cuFFT execution error checking (#2926)
* Adds cuFFT error checking for execution * Removes tabs Co-authored-by: David Clark <daclark@nvidia.com>
fd66bc70 · David Clark · GitHub · b49b82ef · fd66bc70
Unverified Commit fd66bc70 authored Dec 10, 2020 by David Clark Committed by GitHub Dec 10, 2020
Show whitespace changes
Inline Side-by-side

Showing with 37 additions and 17 deletions

platforms/cuda/src/CudaKernels.cpp platforms/cuda/src/CudaKernels.cpp +37 -17

No files found.
--- a/platforms/cuda/src/CudaKernels.cpp
+++ b/platforms/cuda/src/CudaKernels.cpp
@@ -1293,10 +1293,15 @@ double CudaCalcNonbondedForceKernel::execute(ContextImpl& context, bool includeF
            cu.executeKernel(pmeFinishSpreadChargeKernel, finishSpreadArgs, gridSizeX*gridSizeY*gridSizeZ, 256);
            if (useCudaFFT) {
-                if (cu.getUseDoublePrecision())
+                if (cu.getUseDoublePrecision()) {
-                    cufftExecD2Z(fftForward, (double*) pmeGrid1.getDevicePointer(), (double2*) pmeGrid2.getDevicePointer());
+                    cufftResult result = cufftExecD2Z(fftForward, (double*) pmeGrid1.getDevicePointer(), (double2*) pmeGrid2.getDevicePointer());
-                else
+                    if (result != CUFFT_SUCCESS)
-                    cufftExecR2C(fftForward, (float*) pmeGrid1.getDevicePointer(), (float2*) pmeGrid2.getDevicePointer());
+                        throw OpenMMException("Error executing FFT: "+cu.intToString(result));
+                } else {
+                    cufftResult result = cufftExecR2C(fftForward, (float*) pmeGrid1.getDevicePointer(), (float2*) pmeGrid2.getDevicePointer());
+                    if (result != CUFFT_SUCCESS)
+                        throw OpenMMException("Error executing FFT: "+cu.intToString(result));
+                }
            }
            else {
                fft->execFFT(pmeGrid1, pmeGrid2, true);
@@ -1315,10 +1320,15 @@ double CudaCalcNonbondedForceKernel::execute(ContextImpl& context, bool includeF
            cu.executeKernel(pmeConvolutionKernel, convolutionArgs, gridSizeX*gridSizeY*gridSizeZ, 256);
            if (useCudaFFT) {
-                if (cu.getUseDoublePrecision())
+                if (cu.getUseDoublePrecision()) {
-                    cufftExecZ2D(fftBackward, (double2*) pmeGrid2.getDevicePointer(), (double*) pmeGrid1.getDevicePointer());
+                    cufftResult result = cufftExecZ2D(fftBackward, (double2*) pmeGrid2.getDevicePointer(), (double*) pmeGrid1.getDevicePointer());
-                else
+                    if (result != CUFFT_SUCCESS)
-                    cufftExecC2R(fftBackward, (float2*) pmeGrid2.getDevicePointer(), (float*)  pmeGrid1.getDevicePointer());
+                        throw OpenMMException("Error executing FFT: "+cu.intToString(result));
+                } else {
+                    cufftResult result = cufftExecC2R(fftBackward, (float2*) pmeGrid2.getDevicePointer(), (float*)  pmeGrid1.getDevicePointer());
+                    if (result != CUFFT_SUCCESS)
+                        throw OpenMMException("Error executing FFT: "+cu.intToString(result));
+                }
            }
            else {
                fft->execFFT(pmeGrid2, pmeGrid1, false);
@@ -1353,10 +1363,15 @@ double CudaCalcNonbondedForceKernel::execute(ContextImpl& context, bool includeF
            cu.executeKernel(pmeDispersionFinishSpreadChargeKernel, finishSpreadArgs, dispersionGridSizeX*dispersionGridSizeY*dispersionGridSizeZ, 256);
            if (useCudaFFT) {
-                if (cu.getUseDoublePrecision())
+                if (cu.getUseDoublePrecision()) {
-                    cufftExecD2Z(dispersionFftForward, (double*) pmeGrid1.getDevicePointer(), (double2*) pmeGrid2.getDevicePointer());
+                    cufftResult result = cufftExecD2Z(dispersionFftForward, (double*) pmeGrid1.getDevicePointer(), (double2*) pmeGrid2.getDevicePointer());
-                else
+                    if (result != CUFFT_SUCCESS)
-                    cufftExecR2C(dispersionFftForward, (float*) pmeGrid1.getDevicePointer(), (float2*) pmeGrid2.getDevicePointer());
+                        throw OpenMMException("Error executing FFT: "+cu.intToString(result));
+                } else {
+                    cufftResult result = cufftExecR2C(dispersionFftForward, (float*) pmeGrid1.getDevicePointer(), (float2*) pmeGrid2.getDevicePointer());
+                    if (result != CUFFT_SUCCESS)
+                        throw OpenMMException("Error executing FFT: "+cu.intToString(result));
+                }
            }
            else {
                dispersionFft->execFFT(pmeGrid1, pmeGrid2, true);
@@ -1375,10 +1390,15 @@ double CudaCalcNonbondedForceKernel::execute(ContextImpl& context, bool includeF
            cu.executeKernel(pmeDispersionConvolutionKernel, convolutionArgs, dispersionGridSizeX*dispersionGridSizeY*dispersionGridSizeZ, 256);
            if (useCudaFFT) {
-                if (cu.getUseDoublePrecision())
+                if (cu.getUseDoublePrecision()) {
-                    cufftExecZ2D(dispersionFftBackward, (double2*) pmeGrid2.getDevicePointer(), (double*) pmeGrid1.getDevicePointer());
+                    cufftResult result = cufftExecZ2D(dispersionFftBackward, (double2*) pmeGrid2.getDevicePointer(), (double*) pmeGrid1.getDevicePointer());
-                else
+                    if (result != CUFFT_SUCCESS)
-                    cufftExecC2R(dispersionFftBackward, (float2*) pmeGrid2.getDevicePointer(), (float*)  pmeGrid1.getDevicePointer());
+                        throw OpenMMException("Error executing FFT: "+cu.intToString(result));
+                } else {
+                    cufftResult result = cufftExecC2R(dispersionFftBackward, (float2*) pmeGrid2.getDevicePointer(), (float*)  pmeGrid1.getDevicePointer());
+                    if (result != CUFFT_SUCCESS)
+                        throw OpenMMException("Error executing FFT: "+cu.intToString(result));
+                }
            }
            else {
                dispersionFft->execFFT(pmeGrid2, pmeGrid1, false);