Bug fix

19841146 · peastman · 94aa8c3f · 19841146 · 19841146
Commit 19841146 authored Oct 09, 2014 by peastman
Hide whitespace changes
Inline Side-by-side

Showing with 32 additions and 15 deletions

platforms/cuda/src/CudaKernels.cpp platforms/cuda/src/CudaKernels.cpp +15 -7

platforms/opencl/src/OpenCLKernels.cpp platforms/opencl/src/OpenCLKernels.cpp +17 -8

No files found.
--- a/platforms/cuda/src/CudaKernels.cpp
+++ b/platforms/cuda/src/CudaKernels.cpp
@@ -1400,27 +1400,32 @@ private:
 class CudaCalcNonbondedForceKernel::SyncStreamPreComputation : public CudaContext::ForcePreComputation {
 public:
-    SyncStreamPreComputation(CUstream stream, CUevent event) : stream(stream), event(event) {
+    SyncStreamPreComputation(CUstream stream, CUevent event, int forceGroup) : stream(stream), event(event), forceGroup(forceGroup) {
    }
    void computeForceAndEnergy(bool includeForces, bool includeEnergy, int groups) {
-        cuEventRecord(event, 0);
+        if ((groups&(1<<forceGroup)) != 0) {
-        cuStreamWaitEvent(stream, event, 0);
+            cuEventRecord(event, 0);
+            cuStreamWaitEvent(stream, event, 0);
+        }
    }
 private:
    CUstream stream;
    CUevent event;
+    int forceGroup;
 };
 class CudaCalcNonbondedForceKernel::SyncStreamPostComputation : public CudaContext::ForcePostComputation {
 public:
-    SyncStreamPostComputation(CUevent event) : event(event) {
+    SyncStreamPostComputation(CUevent event, int forceGroup) : event(event), forceGroup(forceGroup) {
    }
    double computeForceAndEnergy(bool includeForces, bool includeEnergy, int groups) {
-        cuStreamWaitEvent(0, event, 0);
+        if ((groups&(1<<forceGroup)) != 0)
+            cuStreamWaitEvent(0, event, 0);
        return 0.0;
    }
 private:
    CUevent event;
+    int forceGroup;
 };
 CudaCalcNonbondedForceKernel::~CudaCalcNonbondedForceKernel() {
@@ -1669,8 +1674,11 @@ void CudaCalcNonbondedForceKernel::initialize(const System& system, const Nonbon
                cufftSetStream(fftForward, pmeStream);
                cufftSetStream(fftBackward, pmeStream);
                CHECK_RESULT(cuEventCreate(&pmeSyncEvent, CU_EVENT_DISABLE_TIMING), "Error creating event for NonbondedForce");
-                cu.addPreComputation(new SyncStreamPreComputation(pmeStream, pmeSyncEvent));
+                int recipForceGroup = force.getReciprocalSpaceForceGroup();
-                cu.addPostComputation(new SyncStreamPostComputation(pmeSyncEvent));
+                if (recipForceGroup < 0)
+                    recipForceGroup = force.getForceGroup();
+                cu.addPreComputation(new SyncStreamPreComputation(pmeStream, pmeSyncEvent, recipForceGroup));
+                cu.addPostComputation(new SyncStreamPostComputation(pmeSyncEvent, recipForceGroup));
                hasInitializedFFT = true;
                // Initialize the b-spline moduli.

--- a/platforms/opencl/src/OpenCLKernels.cpp
+++ b/platforms/opencl/src/OpenCLKernels.cpp
@@ -1386,31 +1386,37 @@ private:
 class OpenCLCalcNonbondedForceKernel::SyncQueuePreComputation : public OpenCLContext::ForcePreComputation {
 public:
-    SyncQueuePreComputation(OpenCLContext& cl, cl::CommandQueue queue) : cl(cl), queue(queue), events(1) {
+    SyncQueuePreComputation(OpenCLContext& cl, cl::CommandQueue queue, int forceGroup) : cl(cl), queue(queue), events(1), forceGroup(forceGroup) {
    }
    void computeForceAndEnergy(bool includeForces, bool includeEnergy, int groups) {
-        cl.getQueue().enqueueMarker(&events[0]);
+        if ((groups&(1<<forceGroup)) != 0) {
-        queue.enqueueWaitForEvents(events);
+            cl.getQueue().enqueueMarker(&events[0]);
+            queue.enqueueWaitForEvents(events);
+        }
    }
 private:
    OpenCLContext& cl;
    cl::CommandQueue queue;
    vector<cl::Event> events;
+    int forceGroup;
 };
 class OpenCLCalcNonbondedForceKernel::SyncQueuePostComputation : public OpenCLContext::ForcePostComputation {
 public:
-    SyncQueuePostComputation(OpenCLContext& cl, cl::Event& event) : cl(cl), event(event), events(1) {
+    SyncQueuePostComputation(OpenCLContext& cl, cl::Event& event, int forceGroup) : cl(cl), event(event), events(1), forceGroup(forceGroup) {
    }
    double computeForceAndEnergy(bool includeForces, bool includeEnergy, int groups) {
-        events[0] = event;
+        if ((groups&(1<<forceGroup)) != 0) {
-        cl.getQueue().enqueueWaitForEvents(events);
+            events[0] = event;
+            cl.getQueue().enqueueWaitForEvents(events);
+        }
        return 0.0;
    }
 private:
    OpenCLContext& cl;
    cl::Event& event;
    vector<cl::Event> events;
+    int forceGroup;
 };
 OpenCLCalcNonbondedForceKernel::~OpenCLCalcNonbondedForceKernel() {
@@ -1604,8 +1610,11 @@ void OpenCLCalcNonbondedForceKernel::initialize(const System& system, const Nonb
                sort = new OpenCLSort(cl, new SortTrait(), cl.getNumAtoms());
                fft = new OpenCLFFT3D(cl, gridSizeX, gridSizeY, gridSizeZ);
                pmeQueue = cl::CommandQueue(cl.getContext(), cl.getDevice());
-                cl.addPreComputation(new SyncQueuePreComputation(cl, pmeQueue));
+                int recipForceGroup = force.getReciprocalSpaceForceGroup();
-                cl.addPostComputation(new SyncQueuePostComputation(cl, pmeSyncEvent));
+                if (recipForceGroup < 0)
+                    recipForceGroup = force.getForceGroup();
+                cl.addPreComputation(new SyncQueuePreComputation(cl, pmeQueue, recipForceGroup));
+                cl.addPostComputation(new SyncQueuePostComputation(cl, pmeSyncEvent, recipForceGroup));
                // Initialize the b-spline moduli.