/* -------------------------------------------------------------------------- * * OpenMM * * -------------------------------------------------------------------------- * * This is part of the OpenMM molecular simulation toolkit originating from * * Simbios, the NIH National Center for Physics-Based Simulation of * * Biological Structures at Stanford, funded under the NIH Roadmap for * * Medical Research, grant U54 GM072970. See https://simtk.org. * * * * Portions copyright (c) 2008-2009 Stanford University and the Authors. * * Authors: Peter Eastman * * Contributors: * * * * This program is free software: you can redistribute it and/or modify * * it under the terms of the GNU Lesser General Public License as published * * by the Free Software Foundation, either version 3 of the License, or * * (at your option) any later version. * * * * This program is distributed in the hope that it will be useful, * * but WITHOUT ANY WARRANTY; without even the implied warranty of * * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the * * GNU Lesser General Public License for more details. * * * * You should have received a copy of the GNU Lesser General Public License * * along with this program. If not, see . * * -------------------------------------------------------------------------- */ #include "OpenCLKernels.h" #include "OpenCLForceInfo.h" #include "openmm/LangevinIntegrator.h" #include "openmm/Context.h" #include "openmm/internal/ContextImpl.h" #include "OpenCLIntegrationUtilities.h" #include using namespace OpenMM; using namespace std; void OpenCLCalcForcesAndEnergyKernel::initialize(const System& system) { } void OpenCLCalcForcesAndEnergyKernel::beginForceComputation(ContextImpl& context) { cl.clearBuffer(cl.getForceBuffers()); } void OpenCLCalcForcesAndEnergyKernel::finishForceComputation(ContextImpl& context) { cl.reduceBuffer(cl.getForceBuffers(), cl.getNumForceBuffers()); } void OpenCLCalcForcesAndEnergyKernel::beginEnergyComputation(ContextImpl& context) { cl.clearBuffer(cl.getEnergyBuffer()); } double OpenCLCalcForcesAndEnergyKernel::finishEnergyComputation(ContextImpl& context) { OpenCLArray& energy = cl.getEnergyBuffer(); energy.download(); double sum = 0.0f; for (int i = 0; i < energy.getSize(); i++) sum += energy[i]; return sum; } void OpenCLUpdateStateDataKernel::initialize(const System& system) { } double OpenCLUpdateStateDataKernel::getTime(const ContextImpl& context) const { return cl.getTime(); } void OpenCLUpdateStateDataKernel::setTime(ContextImpl& context, double time) { cl.setTime(time); } void OpenCLUpdateStateDataKernel::getPositions(ContextImpl& context, std::vector& positions) { OpenCLArray& posq = cl.getPosq(); posq.download(); OpenCLArray& order = cl.getAtomIndex(); int numParticles = context.getSystem().getNumParticles(); positions.resize(numParticles); for (int i = 0; i < numParticles; ++i) { mm_float4 pos = posq[i]; // int3 offset = gpu->posCellOffsets[i]; // positions[order[i]] = Vec3(pos.x-offset.x*gpu->sim.periodicBoxSizeX, pos.y-offset.y*gpu->sim.periodicBoxSizeY, pos.z-offset.z*gpu->sim.periodicBoxSizeZ); positions[order[i]] = Vec3(pos.x, pos.y, pos.z); } } void OpenCLUpdateStateDataKernel::setPositions(ContextImpl& context, const std::vector& positions) { OpenCLArray& posq = cl.getPosq(); OpenCLArray& order = cl.getAtomIndex(); int numParticles = context.getSystem().getNumParticles(); for (int i = 0; i < numParticles; ++i) { mm_float4& pos = posq[i]; const Vec3& p = positions[order[i]]; pos.x = p[0]; pos.y = p[1]; pos.z = p[2]; } posq.upload(); // for (int i = 0; i < gpu->posCellOffsets.size(); i++) // gpu->posCellOffsets[i] = make_int3(0, 0, 0); } void OpenCLUpdateStateDataKernel::getVelocities(ContextImpl& context, std::vector& velocities) { OpenCLArray& velm = cl.getVelm(); velm.download(); OpenCLArray& order = cl.getAtomIndex(); int numParticles = context.getSystem().getNumParticles(); velocities.resize(numParticles); for (int i = 0; i < numParticles; ++i) { mm_float4 vel = velm[i]; velocities[order[i]] = Vec3(vel.x, vel.y, vel.z); } } void OpenCLUpdateStateDataKernel::setVelocities(ContextImpl& context, const std::vector& velocities) { OpenCLArray& velm = cl.getVelm(); OpenCLArray& order = cl.getAtomIndex(); int numParticles = context.getSystem().getNumParticles(); for (int i = 0; i < numParticles; ++i) { mm_float4& vel = velm[i]; const Vec3& p = velocities[order[i]]; vel.x = p[0]; vel.y = p[1]; vel.z = p[2]; } velm.upload(); } void OpenCLUpdateStateDataKernel::getForces(ContextImpl& context, std::vector& forces) { OpenCLArray& force = cl.getForce(); force.download(); OpenCLArray& order = cl.getAtomIndex(); int numParticles = context.getSystem().getNumParticles(); forces.resize(numParticles); for (int i = 0; i < numParticles; ++i) { mm_float4 f = force[i]; forces[order[i]] = Vec3(f.x, f.y, f.z); } } class OpenCLBondForceInfo : public OpenCLForceInfo { public: OpenCLBondForceInfo(int requiredBuffers, const HarmonicBondForce& force) : OpenCLForceInfo(requiredBuffers, false, 0.0), force(force) { } int getNumParticleGroups() { return force.getNumBonds(); } void getParticlesInGroup(int index, std::vector& particles) { int particle1, particle2; double length, k; force.getBondParameters(index, particle1, particle2, length, k); particles.resize(2); particles[0] = particle1; particles[1] = particle2; } bool areGroupsIdentical(int group1, int group2) { int particle1, particle2; double length1, length2, k1, k2; force.getBondParameters(group1, particle1, particle2, length1, k1); force.getBondParameters(group2, particle1, particle2, length2, k2); return (length1 == length2 && k1 == k2); } private: const HarmonicBondForce& force; }; OpenCLCalcHarmonicBondForceKernel::~OpenCLCalcHarmonicBondForceKernel() { if (params != NULL) delete params; if (indices != NULL) delete indices; } void OpenCLCalcHarmonicBondForceKernel::initialize(const System& system, const HarmonicBondForce& force) { numBonds = force.getNumBonds(); params = new OpenCLArray(cl, numBonds, "bondParams"); indices = new OpenCLArray(cl, numBonds, "bondIndices"); vector forceBufferCounter(system.getNumParticles(), 0); vector paramVector(numBonds); vector indicesVector(numBonds); for (int i = 0; i < numBonds; i++) { int particle1, particle2; double length, k; force.getBondParameters(i, particle1, particle2, length, k); paramVector[i] = (mm_float2) {length, k}; indicesVector[i] = (mm_int4) {particle1, particle2, forceBufferCounter[particle1]++, forceBufferCounter[particle2]++}; } params->upload(paramVector); indices->upload(indicesVector); int maxBuffers = 1; for (int i = 0; i < forceBufferCounter.size(); i++) { maxBuffers = max(maxBuffers, forceBufferCounter[i]); } cl.addForce(new OpenCLBondForceInfo(maxBuffers, force)); cl::Program program = cl.createProgram(cl.loadSourceFromFile("harmonicBondForce.cl")); kernel = cl::Kernel(program, "calcHarmonicBondForce"); } void OpenCLCalcHarmonicBondForceKernel::executeForces(ContextImpl& context) { kernel.setArg(0, cl.getPaddedNumAtoms()); kernel.setArg(1, numBonds); kernel.setArg(2, cl.getForceBuffers().getDeviceBuffer()); kernel.setArg(3, cl.getEnergyBuffer().getDeviceBuffer()); kernel.setArg(4, cl.getPosq().getDeviceBuffer()); kernel.setArg(5, params->getDeviceBuffer()); kernel.setArg(6, indices->getDeviceBuffer()); cl.executeKernel(kernel, numBonds); } double OpenCLCalcHarmonicBondForceKernel::executeEnergy(ContextImpl& context) { executeForces(context); return 0.0; } class OpenCLAngleForceInfo : public OpenCLForceInfo { public: OpenCLAngleForceInfo(int requiredBuffers, const HarmonicAngleForce& force) : OpenCLForceInfo(requiredBuffers, false, 0.0), force(force) { } int getNumParticleGroups() { return force.getNumAngles(); } void getParticlesInGroup(int index, std::vector& particles) { int particle1, particle2, particle3; double angle, k; force.getAngleParameters(index, particle1, particle2, particle3, angle, k); particles.resize(3); particles[0] = particle1; particles[1] = particle2; particles[2] = particle3; } bool areGroupsIdentical(int group1, int group2) { int particle1, particle2, particle3; double angle1, angle2, k1, k2; force.getAngleParameters(group1, particle1, particle2, particle3, angle1, k1); force.getAngleParameters(group2, particle1, particle2, particle3, angle2, k2); return (angle1 == angle2 && k1 == k2); } private: const HarmonicAngleForce& force; }; OpenCLCalcHarmonicAngleForceKernel::~OpenCLCalcHarmonicAngleForceKernel() { if (params != NULL) delete params; if (indices != NULL) delete indices; } void OpenCLCalcHarmonicAngleForceKernel::initialize(const System& system, const HarmonicAngleForce& force) { numAngles = force.getNumAngles(); params = new OpenCLArray(cl, numAngles, "angleParams"); indices = new OpenCLArray(cl, numAngles, "angleIndices"); vector forceBufferCounter(system.getNumParticles(), 0); vector paramVector(numAngles); vector indicesVector(numAngles); for (int i = 0; i < numAngles; i++) { int particle1, particle2, particle3; double angle, k; force.getAngleParameters(i, particle1, particle2, particle3, angle, k); paramVector[i] = (mm_float2) {angle, k}; indicesVector[i] = (mm_int8) {particle1, particle2, particle3, forceBufferCounter[particle1]++, forceBufferCounter[particle2]++, forceBufferCounter[particle3]++, 0, 0}; } params->upload(paramVector); indices->upload(indicesVector); int maxBuffers = 1; for (int i = 0; i < forceBufferCounter.size(); i++) { maxBuffers = max(maxBuffers, forceBufferCounter[i]); } cl.addForce(new OpenCLAngleForceInfo(maxBuffers, force)); cl::Program program = cl.createProgram(cl.loadSourceFromFile("harmonicAngleForce.cl")); kernel = cl::Kernel(program, "calcHarmonicAngleForce"); } void OpenCLCalcHarmonicAngleForceKernel::executeForces(ContextImpl& context) { kernel.setArg(0, cl.getPaddedNumAtoms()); kernel.setArg(1, numAngles); kernel.setArg(2, cl.getForceBuffers().getDeviceBuffer()); kernel.setArg(3, cl.getEnergyBuffer().getDeviceBuffer()); kernel.setArg(4, cl.getPosq().getDeviceBuffer()); kernel.setArg(5, params->getDeviceBuffer()); kernel.setArg(6, indices->getDeviceBuffer()); cl.executeKernel(kernel, numAngles); } double OpenCLCalcHarmonicAngleForceKernel::executeEnergy(ContextImpl& context) { executeForces(context); return 0.0; } class OpenCLPeriodicTorsionForceInfo : public OpenCLForceInfo { public: OpenCLPeriodicTorsionForceInfo(int requiredBuffers, const PeriodicTorsionForce& force) : OpenCLForceInfo(requiredBuffers, false, 0.0), force(force) { } int getNumParticleGroups() { return force.getNumTorsions(); } void getParticlesInGroup(int index, std::vector& particles) { int particle1, particle2, particle3, particle4, periodicity; double phase, k; force.getTorsionParameters(index, particle1, particle2, particle3, particle4, periodicity, phase, k); particles.resize(4); particles[0] = particle1; particles[1] = particle2; particles[2] = particle3; particles[3] = particle4; } bool areGroupsIdentical(int group1, int group2) { int particle1, particle2, particle3, particle4, periodicity1, periodicity2; double phase1, phase2, k1, k2; force.getTorsionParameters(group1, particle1, particle2, particle3, particle4, periodicity1, phase1, k1); force.getTorsionParameters(group1, particle1, particle2, particle3, particle4, periodicity2, phase2, k2); return (periodicity1 == periodicity2 && phase1 == phase2 && k1 == k2); } private: const PeriodicTorsionForce& force; }; OpenCLCalcPeriodicTorsionForceKernel::~OpenCLCalcPeriodicTorsionForceKernel() { if (params != NULL) delete params; if (indices != NULL) delete indices; } void OpenCLCalcPeriodicTorsionForceKernel::initialize(const System& system, const PeriodicTorsionForce& force) { numTorsions = force.getNumTorsions(); params = new OpenCLArray(cl, numTorsions, "periodicTorsionParams"); indices = new OpenCLArray(cl, numTorsions, "periodicTorsionIndices"); vector forceBufferCounter(system.getNumParticles(), 0); vector paramVector(numTorsions); vector indicesVector(numTorsions); for (int i = 0; i < numTorsions; i++) { int particle1, particle2, particle3, particle4, periodicity; double phase, k; force.getTorsionParameters(i, particle1, particle2, particle3, particle4, periodicity, phase, k); paramVector[i] = (mm_float4) {k, phase, (float) periodicity}; indicesVector[i] = (mm_int8) {particle1, particle2, particle3, particle4, forceBufferCounter[particle1]++, forceBufferCounter[particle2]++, forceBufferCounter[particle3]++, forceBufferCounter[particle4]++}; } params->upload(paramVector); indices->upload(indicesVector); int maxBuffers = 1; for (int i = 0; i < forceBufferCounter.size(); i++) { maxBuffers = max(maxBuffers, forceBufferCounter[i]); } cl.addForce(new OpenCLPeriodicTorsionForceInfo(maxBuffers, force)); cl::Program program = cl.createProgram(cl.loadSourceFromFile("periodicTorsionForce.cl")); kernel = cl::Kernel(program, "calcPeriodicTorsionForce"); } void OpenCLCalcPeriodicTorsionForceKernel::executeForces(ContextImpl& context) { kernel.setArg(0, cl.getPaddedNumAtoms()); kernel.setArg(1, numTorsions); kernel.setArg(2, cl.getForceBuffers().getDeviceBuffer()); kernel.setArg(3, cl.getEnergyBuffer().getDeviceBuffer()); kernel.setArg(4, cl.getPosq().getDeviceBuffer()); kernel.setArg(5, params->getDeviceBuffer()); kernel.setArg(6, indices->getDeviceBuffer()); cl.executeKernel(kernel, numTorsions); } double OpenCLCalcPeriodicTorsionForceKernel::executeEnergy(ContextImpl& context) { executeForces(context); return 0.0; } class OpenCLRBTorsionForceInfo : public OpenCLForceInfo { public: OpenCLRBTorsionForceInfo(int requiredBuffers, const RBTorsionForce& force) : OpenCLForceInfo(requiredBuffers, false, 0.0), force(force) { } int getNumParticleGroups() { return force.getNumTorsions(); } void getParticlesInGroup(int index, std::vector& particles) { int particle1, particle2, particle3, particle4; double c0, c1, c2, c3, c4, c5; force.getTorsionParameters(index, particle1, particle2, particle3, particle4, c0, c1, c2, c3, c4, c5); particles.resize(4); particles[0] = particle1; particles[1] = particle2; particles[2] = particle3; particles[3] = particle4; } bool areGroupsIdentical(int group1, int group2) { int particle1, particle2, particle3, particle4; double c0a, c0b, c1a, c1b, c2a, c2b, c3a, c3b, c4a, c4b, c5a, c5b; force.getTorsionParameters(group1, particle1, particle2, particle3, particle4, c0a, c1a, c2a, c3a, c4a, c5a); force.getTorsionParameters(group1, particle1, particle2, particle3, particle4, c0b, c1b, c2b, c3b, c4b, c5b); return (c0a == c0b && c1a == c1b && c2a == c2b && c3a == c3b && c4a == c4b && c5a == c5b); } private: const RBTorsionForce& force; }; OpenCLCalcRBTorsionForceKernel::~OpenCLCalcRBTorsionForceKernel() { if (params != NULL) delete params; if (indices != NULL) delete indices; } void OpenCLCalcRBTorsionForceKernel::initialize(const System& system, const RBTorsionForce& force) { numTorsions = force.getNumTorsions(); params = new OpenCLArray(cl, numTorsions, "rbTorsionParams"); indices = new OpenCLArray(cl, numTorsions, "rbTorsionIndices"); vector forceBufferCounter(system.getNumParticles(), 0); vector paramVector(numTorsions); vector indicesVector(numTorsions); for (int i = 0; i < numTorsions; i++) { int particle1, particle2, particle3, particle4; double c0, c1, c2, c3, c4, c5; force.getTorsionParameters(i, particle1, particle2, particle3, particle4, c0, c1, c2, c3, c4, c5); paramVector[i] = (mm_float8) {c0, c1, c2, c3, c4, c5}; indicesVector[i] = (mm_int8) {particle1, particle2, particle3, particle4, forceBufferCounter[particle1]++, forceBufferCounter[particle2]++, forceBufferCounter[particle3]++, forceBufferCounter[particle4]++}; } params->upload(paramVector); indices->upload(indicesVector); int maxBuffers = 1; for (int i = 0; i < forceBufferCounter.size(); i++) { maxBuffers = max(maxBuffers, forceBufferCounter[i]); } cl.addForce(new OpenCLRBTorsionForceInfo(maxBuffers, force)); cl::Program program = cl.createProgram(cl.loadSourceFromFile("rbTorsionForce.cl")); kernel = cl::Kernel(program, "calcRBTorsionForce"); } void OpenCLCalcRBTorsionForceKernel::executeForces(ContextImpl& context) { kernel.setArg(0, cl.getPaddedNumAtoms()); kernel.setArg(1, numTorsions); kernel.setArg(2, cl.getForceBuffers().getDeviceBuffer()); kernel.setArg(3, cl.getEnergyBuffer().getDeviceBuffer()); kernel.setArg(4, cl.getPosq().getDeviceBuffer()); kernel.setArg(5, params->getDeviceBuffer()); kernel.setArg(6, indices->getDeviceBuffer()); cl.executeKernel(kernel, numTorsions); } double OpenCLCalcRBTorsionForceKernel::executeEnergy(ContextImpl& context) { executeForces(context); return 0.0; } //OpenCLCalcNonbondedForceKernel::~OpenCLCalcNonbondedForceKernel() { //} // //void OpenCLCalcNonbondedForceKernel::initialize(const System& system, const NonbondedForce& force) { // if (data.primaryKernel == NULL) // data.primaryKernel = this; // data.hasNonbonded = true; // numParticles = force.getNumParticles(); // _gpuContext* gpu = data.gpu; // // // Identify which exceptions are 1-4 interactions. // // vector > exclusions; // vector exceptions; // for (int i = 0; i < force.getNumExceptions(); i++) { // int particle1, particle2; // double chargeProd, sigma, epsilon; // force.getExceptionParameters(i, particle1, particle2, chargeProd, sigma, epsilon); // exclusions.push_back(pair(particle1, particle2)); // if (chargeProd != 0.0 || epsilon != 0.0) // exceptions.push_back(i); // } // // // Initialize nonbonded interactions. // // { // vector particle(numParticles); // vector c6(numParticles); // vector c12(numParticles); // vector q(numParticles); // vector symbol; // vector > exclusionList(numParticles); // for (int i = 0; i < numParticles; i++) { // double charge, radius, depth; // force.getParticleParameters(i, charge, radius, depth); // particle[i] = i; // q[i] = (float) charge; // c6[i] = (float) (4*depth*pow(radius, 6.0)); // c12[i] = (float) (4*depth*pow(radius, 12.0)); // exclusionList[i].push_back(i); // } // for (int i = 0; i < (int)exclusions.size(); i++) { // exclusionList[exclusions[i].first].push_back(exclusions[i].second); // exclusionList[exclusions[i].second].push_back(exclusions[i].first); // } // Vec3 boxVectors[3]; // system.getPeriodicBoxVectors(boxVectors[0], boxVectors[1], boxVectors[2]); // gpuSetPeriodicBoxSize(gpu, (float)boxVectors[0][0], (float)boxVectors[1][1], (float)boxVectors[2][2]); // OpenCLNonbondedMethod method = NO_CUTOFF; // if (force.getNonbondedMethod() != NonbondedForce::NoCutoff) { // gpuSetNonbondedCutoff(gpu, (float)force.getCutoffDistance(), force.getReactionFieldDielectric()); // method = CUTOFF; // } // if (force.getNonbondedMethod() == NonbondedForce::CutoffPeriodic) { // method = PERIODIC; // } // if (force.getNonbondedMethod() == NonbondedForce::Ewald || force.getNonbondedMethod() == NonbondedForce::PME) { // double ewaldErrorTol = force.getEwaldErrorTolerance(); // double alpha = (1.0/force.getCutoffDistance())*std::sqrt(-std::log(ewaldErrorTol)); // double mx = boxVectors[0][0]/force.getCutoffDistance(); // double my = boxVectors[1][1]/force.getCutoffDistance(); // double mz = boxVectors[2][2]/force.getCutoffDistance(); // double pi = 3.1415926535897932385; // int kmaxx = (int)std::ceil(-(mx/pi)*std::log(ewaldErrorTol)); // int kmaxy = (int)std::ceil(-(my/pi)*std::log(ewaldErrorTol)); // int kmaxz = (int)std::ceil(-(mz/pi)*std::log(ewaldErrorTol)); // if (force.getNonbondedMethod() == NonbondedForce::Ewald) { // if (kmaxx%2 == 0) // kmaxx++; // if (kmaxy%2 == 0) // kmaxy++; // if (kmaxz%2 == 0) // kmaxz++; // gpuSetEwaldParameters(gpu, (float) alpha, kmaxx, kmaxy, kmaxz); // method = EWALD; // } // else { // int gridSizeX = -0.5*kmaxx*std::log(ewaldErrorTol); // int gridSizeY = -0.5*kmaxy*std::log(ewaldErrorTol); // int gridSizeZ = -0.5*kmaxz*std::log(ewaldErrorTol); //// printf("%d %d\n", gridSizeX, (int) (kmaxx*std::sqrt(-std::log(ewaldErrorTol)))); //// gridSizeX = 0.02*mx*std::pow(-std::log(1.5*ewaldErrorTol), 3); //// gridSizeY = 0.02*my*std::pow(-std::log(1.5*ewaldErrorTol), 3); //// gridSizeZ = 0.02*mz*std::pow(-std::log(1.5*ewaldErrorTol), 3); //// double scale = 0.698*std::pow(ewaldErrorTol, -0.312); //// double scale = 0.713*std::pow(ewaldErrorTol, -0.261); //// printf("%f\n", scale); // gridSizeX = mx*NonbondedForce::PMEscale; // gridSizeY = my*NonbondedForce::PMEscale; // gridSizeZ = mz*NonbondedForce::PMEscale; //// printf("%d %d %d\n", gridSizeX, gridSizeY, gridSizeZ); //// gridSizeX = mx*scale; //// gridSizeY = my*scale; //// gridSizeZ = mz*scale; // gpuSetPMEParameters(gpu, (float) alpha, gridSizeX, gridSizeY, gridSizeZ); // method = PARTICLE_MESH_EWALD; // } // } // data.nonbondedMethod = method; // gpuSetCoulombParameters(gpu, 138.935485f, particle, c6, c12, q, symbol, exclusionList, method); // // // Compute the Ewald self energy. // // data.ewaldSelfEnergy = 0.0; // if (force.getNonbondedMethod() == NonbondedForce::Ewald || force.getNonbondedMethod() == NonbondedForce::PME) { // double selfEnergyScale = gpu->sim.epsfac*gpu->sim.alphaEwald/std::sqrt(PI); // for (int i = 0; i < numParticles; i++) // data.ewaldSelfEnergy -= selfEnergyScale*q[i]*q[i]; // } // } // // // Initialize 1-4 nonbonded interactions. // // { // int numExceptions = exceptions.size(); // vector particle1(numExceptions); // vector particle2(numExceptions); // vector c6(numExceptions); // vector c12(numExceptions); // vector q1(numExceptions); // vector q2(numExceptions); // for (int i = 0; i < numExceptions; i++) { // double charge, sig, eps; // force.getExceptionParameters(exceptions[i], particle1[i], particle2[i], charge, sig, eps); // c6[i] = (float) (4*eps*pow(sig, 6.0)); // c12[i] = (float) (4*eps*pow(sig, 12.0)); // q1[i] = (float) charge; // q2[i] = 1.0f; // } // gpuSetLJ14Parameters(gpu, 138.935485f, 1.0f, particle1, particle2, c6, c12, q1, q2); // } //} // //void OpenCLCalcNonbondedForceKernel::executeForces(ContextImpl& context) { // if (data.primaryKernel == this) // calcForces(context, data); //} // //double OpenCLCalcNonbondedForceKernel::executeEnergy(ContextImpl& context) { // if (data.primaryKernel == this) // return calcEnergy(context, data, system); // return 0.0; //} // //OpenCLCalcCustomNonbondedForceKernel::~OpenCLCalcCustomNonbondedForceKernel() { //} // //void OpenCLCalcCustomNonbondedForceKernel::initialize(const System& system, const CustomNonbondedForce& force) { // data.primaryKernel = this; // This must always be the primary kernel so it can update the global parameters // data.hasCustomNonbonded = true; // numParticles = force.getNumParticles(); // _gpuContext* gpu = data.gpu; // // // Identify which exceptions are actual interactions. // // vector > exclusions; // vector exceptions; // { // vector parameters; // for (int i = 0; i < force.getNumExceptions(); i++) { // int particle1, particle2; // force.getExceptionParameters(i, particle1, particle2, parameters); // exclusions.push_back(pair(particle1, particle2)); // if (parameters.size() > 0) // exceptions.push_back(i); // } // } // // // Initialize nonbonded interactions. // // vector particle(numParticles); // vector > parameters(numParticles); // vector > exclusionList(numParticles); // for (int i = 0; i < numParticles; i++) { // force.getParticleParameters(i, parameters[i]); // particle[i] = i; // exclusionList[i].push_back(i); // } // for (int i = 0; i < (int)exclusions.size(); i++) { // exclusionList[exclusions[i].first].push_back(exclusions[i].second); // exclusionList[exclusions[i].second].push_back(exclusions[i].first); // } // Vec3 boxVectors[3]; // system.getPeriodicBoxVectors(boxVectors[0], boxVectors[1], boxVectors[2]); // gpuSetPeriodicBoxSize(gpu, (float)boxVectors[0][0], (float)boxVectors[1][1], (float)boxVectors[2][2]); // OpenCLNonbondedMethod method = NO_CUTOFF; // if (force.getNonbondedMethod() != CustomNonbondedForce::NoCutoff) // method = CUTOFF; // if (force.getNonbondedMethod() == CustomNonbondedForce::CutoffPeriodic) { // method = PERIODIC; // } // data.customNonbondedMethod = method; // // // Initialize exceptions. // // int numExceptions = exceptions.size(); // vector exceptionParticle1(numExceptions); // vector exceptionParticle2(numExceptions); // vector > exceptionParams(numExceptions); // for (int i = 0; i < numExceptions; i++) // force.getExceptionParameters(exceptions[i], exceptionParticle1[i], exceptionParticle2[i], exceptionParams[i]); // // // Record the tabulated functions. // // for (int i = 0; i < force.getNumFunctions(); i++) { // string name; // vector values; // double min, max; // bool interpolating; // force.getFunctionParameters(i, name, values, min, max, interpolating); // gpuSetTabulatedFunction(gpu, i, name, values, min, max, interpolating); // } // // // Record information for the expressions. // // vector paramNames; // vector combiningRules; // for (int i = 0; i < force.getNumParameters(); i++) { // paramNames.push_back(force.getParameterName(i)); // combiningRules.push_back(force.getParameterCombiningRule(i)); // } // globalParamNames.resize(force.getNumGlobalParameters()); // globalParamValues.resize(force.getNumGlobalParameters()); // for (int i = 0; i < force.getNumGlobalParameters(); i++) { // globalParamNames[i] = force.getGlobalParameterName(i); // globalParamValues[i] = force.getGlobalParameterDefaultValue(i); // } // gpuSetCustomNonbondedParameters(gpu, parameters, exclusionList, exceptionParticle1, exceptionParticle2, exceptionParams, method, // (float)force.getCutoffDistance(), force.getEnergyFunction(), combiningRules, paramNames, globalParamNames); // if (globalParamValues.size() > 0) // SetCustomNonbondedGlobalParams(&globalParamValues[0]); //} // //void OpenCLCalcCustomNonbondedForceKernel::executeForces(ContextImpl& context) { // if (data.primaryKernel == this) { // updateGlobalParams(context); // calcForces(context, data); // } //} // //double OpenCLCalcCustomNonbondedForceKernel::executeEnergy(ContextImpl& context) { // if (data.primaryKernel == this) { // updateGlobalParams(context); // return calcEnergy(context, data, system); // } // return 0.0; //} // //void OpenCLCalcCustomNonbondedForceKernel::updateGlobalParams(ContextImpl& context) { // bool changed = false; // for (int i = 0; i < globalParamNames.size(); i++) { // float value = (float) context.getParameter(globalParamNames[i]); // if (value != globalParamValues[i]) // changed = true; // globalParamValues[i] = value; // } // if (changed) // SetCustomNonbondedGlobalParams(&globalParamValues[0]); //} // //OpenCLCalcGBSAOBCForceKernel::~OpenCLCalcGBSAOBCForceKernel() { //} // //void OpenCLCalcGBSAOBCForceKernel::initialize(const System& system, const GBSAOBCForce& force) { // // int numParticles = system.getNumParticles(); // _gpuContext* gpu = data.gpu; // vector radius(numParticles); // vector scale(numParticles); // vector charge(numParticles); // for (int i = 0; i < numParticles; i++) { // double particleCharge, particleRadius, scalingFactor; // force.getParticleParameters(i, particleCharge, particleRadius, scalingFactor); // radius[i] = (float) particleRadius; // scale[i] = (float) scalingFactor; // charge[i] = (float) particleCharge; // } // gpuSetObcParameters(gpu, (float) force.getSoluteDielectric(), (float) force.getSolventDielectric(), radius, scale, charge); //} // //void OpenCLCalcGBSAOBCForceKernel::executeForces(ContextImpl& context) { //} // //static void initializeIntegration(const System& system, OpenCLPlatform::PlatformData& data, const Integrator& integrator) { // // // Initialize any terms that haven't already been handled by a Force. // // _gpuContext* gpu = data.gpu; // if (!data.hasBonds) // gpuSetBondParameters(gpu, vector(), vector(), vector(), vector()); // if (!data.hasAngles) // gpuSetBondAngleParameters(gpu, vector(), vector(), vector(), vector(), vector()); // if (!data.hasPeriodicTorsions) // gpuSetDihedralParameters(gpu, vector(), vector(), vector(), vector(), vector(), vector(), vector()); // if (!data.hasRB) // gpuSetRbDihedralParameters(gpu, vector(), vector(), vector(), vector(), vector(), vector(), // vector(), vector(), vector(), vector()); // if (!data.hasNonbonded) { // gpuSetCoulombParameters(gpu, 138.935485f, vector(), vector(), vector(), vector(), vector(), vector >(), NO_CUTOFF); // gpuSetLJ14Parameters(gpu, 138.935485f, 1.0f, vector(), vector(), vector(), vector(), vector(), vector()); // } // // // Set masses. // // int numParticles = system.getNumParticles(); // vector mass(numParticles); // for (int i = 0; i < numParticles; i++) // mass[i] = (float) system.getParticleMass(i); // gpuSetMass(gpu, mass); // // // Set constraints. // // int numConstraints = system.getNumConstraints(); // vector particle1(numConstraints); // vector particle2(numConstraints); // vector distance(numConstraints); // vector invMass1(numConstraints); // vector invMass2(numConstraints); // for (int i = 0; i < numConstraints; i++) { // int particle1Index, particle2Index; // double constraintDistance; // system.getConstraintParameters(i, particle1Index, particle2Index, constraintDistance); // particle1[i] = particle1Index; // particle2[i] = particle2Index; // distance[i] = (float) constraintDistance; // invMass1[i] = 1.0f/mass[particle1Index]; // invMass2[i] = 1.0f/mass[particle2Index]; // } // gpuSetConstraintParameters(gpu, particle1, particle2, distance, invMass1, invMass2, (float)integrator.getConstraintTolerance()); // // // Finish initialization. // // gpuBuildThreadBlockWorkList(gpu); // gpuBuildExclusionList(gpu); // gpuBuildOutputBuffers(gpu); // gpuSetConstants(gpu); // kClearBornForces(gpu); // kClearForces(gpu); // cudaThreadSynchronize(); //} // //double OpenCLCalcGBSAOBCForceKernel::executeEnergy(ContextImpl& context) { // return 0.0; //} OpenCLIntegrateVerletStepKernel::~OpenCLIntegrateVerletStepKernel() { } void OpenCLIntegrateVerletStepKernel::initialize(const System& system, const VerletIntegrator& integrator) { cl.initialize(system); cl::Program program = cl.createProgram(cl.loadSourceFromFile("verlet.cl")); kernel1 = cl::Kernel(program, "integrateVerletPart1"); kernel2 = cl::Kernel(program, "integrateVerletPart2"); } void OpenCLIntegrateVerletStepKernel::execute(ContextImpl& context, const VerletIntegrator& integrator) { OpenCLIntegrationUtilities& integration = cl.getIntegrationUtilties(); int numAtoms = cl.getNumAtoms(); double dt = integrator.getStepSize(); // Call the first integration kernel. kernel1.setArg(0, numAtoms); kernel1.setArg(1, dt); kernel1.setArg(2, cl.getPosq().getDeviceBuffer()); kernel1.setArg(3, cl.getVelm().getDeviceBuffer()); kernel1.setArg(4, cl.getForce().getDeviceBuffer()); kernel1.setArg(5, integration.getPosDelta().getDeviceBuffer()); kernel1.setArg(6, integration.getOldPos().getDeviceBuffer()); cl.executeKernel(kernel1, numAtoms); // Apply constraints. integration.applyConstraints(integrator.getConstraintTolerance(), integration.getOldPos(), integration.getPosDelta(), integration.getPosDelta()); // Call the second integration kernel. kernel2.setArg(0, numAtoms); kernel2.setArg(1, dt); kernel2.setArg(2, cl.getPosq().getDeviceBuffer()); kernel2.setArg(3, cl.getVelm().getDeviceBuffer()); kernel2.setArg(4, integration.getPosDelta().getDeviceBuffer()); cl.executeKernel(kernel2, numAtoms); // Update the time and step count. cl.setTime(cl.getTime()+dt); cl.setStepCount(cl.getStepCount()+1); } //OpenCLIntegrateLangevinStepKernel::~OpenCLIntegrateLangevinStepKernel() { //} // //void OpenCLIntegrateLangevinStepKernel::initialize(const System& system, const LangevinIntegrator& integrator) { // initializeIntegration(system, data, integrator); // _gpuContext* gpu = data.gpu; // gpu->seed = (unsigned long) integrator.getRandomNumberSeed(); // gpuInitializeRandoms(gpu); // prevStepSize = -1.0; //} // //void OpenCLIntegrateLangevinStepKernel::execute(ContextImpl& context, const LangevinIntegrator& integrator) { // _gpuContext* gpu = data.gpu; // double temperature = integrator.getTemperature(); // double friction = integrator.getFriction(); // double stepSize = integrator.getStepSize(); // if (temperature != prevTemp || friction != prevFriction || stepSize != prevStepSize) { // // Initialize the GPU parameters. // // double tau = (friction == 0.0 ? 0.0 : 1.0/friction); // gpuSetLangevinIntegrationParameters(gpu, (float) tau, (float) stepSize, (float) temperature, 0.0f); // gpuSetConstants(gpu); // kGenerateRandoms(gpu); // prevTemp = temperature; // prevFriction = friction; // prevStepSize = stepSize; // } // kLangevinUpdatePart1(gpu); // kApplyFirstShake(gpu); // kApplyFirstSettle(gpu); // kApplyFirstCCMA(gpu); // if (data.removeCM) // if (data.stepCount%data.cmMotionFrequency == 0) // gpu->bCalculateCM = true; // kLangevinUpdatePart2(gpu); // kApplySecondShake(gpu); // kApplySecondSettle(gpu); // kApplySecondCCMA(gpu); // data.time += stepSize; // data.stepCount++; //} // //OpenCLIntegrateBrownianStepKernel::~OpenCLIntegrateBrownianStepKernel() { //} // //void OpenCLIntegrateBrownianStepKernel::initialize(const System& system, const BrownianIntegrator& integrator) { // initializeIntegration(system, data, integrator); // _gpuContext* gpu = data.gpu; // gpu->seed = (unsigned long) integrator.getRandomNumberSeed(); // gpuInitializeRandoms(gpu); // prevStepSize = -1.0; //} // //void OpenCLIntegrateBrownianStepKernel::execute(ContextImpl& context, const BrownianIntegrator& integrator) { // _gpuContext* gpu = data.gpu; // double temperature = integrator.getTemperature(); // double friction = integrator.getFriction(); // double stepSize = integrator.getStepSize(); // if (temperature != prevTemp || friction != prevFriction || stepSize != prevStepSize) { // // Initialize the GPU parameters. // // double tau = (friction == 0.0 ? 0.0 : 1.0/friction); // gpuSetBrownianIntegrationParameters(gpu, (float) tau, (float) stepSize, (float) temperature); // gpuSetConstants(gpu); // kGenerateRandoms(gpu); // prevTemp = temperature; // prevFriction = friction; // prevStepSize = stepSize; // } // kBrownianUpdatePart1(gpu); // kApplyFirstShake(gpu); // kApplyFirstSettle(gpu); // kApplyFirstCCMA(gpu); // if (data.removeCM) // if (data.stepCount%data.cmMotionFrequency == 0) // gpu->bCalculateCM = true; // kBrownianUpdatePart2(gpu); // data.time += stepSize; // data.stepCount++; //} // //OpenCLIntegrateVariableVerletStepKernel::~OpenCLIntegrateVariableVerletStepKernel() { //} // //void OpenCLIntegrateVariableVerletStepKernel::initialize(const System& system, const VariableVerletIntegrator& integrator) { // initializeIntegration(system, data, integrator); // prevErrorTol = -1.0; //} // //void OpenCLIntegrateVariableVerletStepKernel::execute(ContextImpl& context, const VariableVerletIntegrator& integrator, double maxTime) { // _gpuContext* gpu = data.gpu; // double errorTol = integrator.getErrorTolerance(); // if (errorTol != prevErrorTol) { // // Initialize the GPU parameters. // // gpuSetVerletIntegrationParameters(gpu, 0.0f, (float) errorTol); // gpuSetConstants(gpu); // prevErrorTol = errorTol; // } // float maxStepSize = (float)(maxTime-data.time); // kSelectVerletStepSize(gpu, maxStepSize); // kVerletUpdatePart1(gpu); // kApplyFirstShake(gpu); // kApplyFirstSettle(gpu); // kApplyFirstCCMA(gpu); // if (data.removeCM) // if (data.stepCount%data.cmMotionFrequency == 0) // gpu->bCalculateCM = true; // kVerletUpdatePart2(gpu); // gpu->psStepSize->Download(); // data.time += (*gpu->psStepSize)[0].y; // if ((*gpu->psStepSize)[0].y == maxStepSize) // data.time = maxTime; // Avoid round-off error // data.stepCount++; //} // //OpenCLIntegrateVariableLangevinStepKernel::~OpenCLIntegrateVariableLangevinStepKernel() { //} // //void OpenCLIntegrateVariableLangevinStepKernel::initialize(const System& system, const VariableLangevinIntegrator& integrator) { // initializeIntegration(system, data, integrator); // _gpuContext* gpu = data.gpu; // gpu->seed = (unsigned long) integrator.getRandomNumberSeed(); // gpuInitializeRandoms(gpu); // prevErrorTol = -1.0; //} // //void OpenCLIntegrateVariableLangevinStepKernel::execute(ContextImpl& context, const VariableLangevinIntegrator& integrator, double maxTime) { // _gpuContext* gpu = data.gpu; // double temperature = integrator.getTemperature(); // double friction = integrator.getFriction(); // double errorTol = integrator.getErrorTolerance(); // if (temperature != prevTemp || friction != prevFriction || errorTol != prevErrorTol) { // // Initialize the GPU parameters. // // double tau = (friction == 0.0 ? 0.0 : 1.0/friction); // gpuSetLangevinIntegrationParameters(gpu, (float) tau, 0.0f, (float) temperature, errorTol); // gpuSetConstants(gpu); // kGenerateRandoms(gpu); // prevTemp = temperature; // prevFriction = friction; // prevErrorTol = errorTol; // } // float maxStepSize = (float)(maxTime-data.time); // kSelectLangevinStepSize(gpu, maxStepSize); // kLangevinUpdatePart1(gpu); // kApplyFirstShake(gpu); // kApplyFirstSettle(gpu); // kApplyFirstCCMA(gpu); // if (data.removeCM) // if (data.stepCount%data.cmMotionFrequency == 0) // gpu->bCalculateCM = true; // kLangevinUpdatePart2(gpu); // kApplySecondShake(gpu); // kApplySecondSettle(gpu); // kApplySecondCCMA(gpu); // gpu->psStepSize->Download(); // data.time += (*gpu->psStepSize)[0].y; // if ((*gpu->psStepSize)[0].y == maxStepSize) // data.time = maxTime; // Avoid round-off error // data.stepCount++; //} // //OpenCLApplyAndersenThermostatKernel::~OpenCLApplyAndersenThermostatKernel() { //} // //void OpenCLApplyAndersenThermostatKernel::initialize(const System& system, const AndersenThermostat& thermostat) { // _gpuContext* gpu = data.gpu; // gpu->seed = (unsigned long) thermostat.getRandomNumberSeed(); // gpuInitializeRandoms(gpu); // prevStepSize = -1.0; //} // //void OpenCLApplyAndersenThermostatKernel::execute(ContextImpl& context) { // _gpuContext* gpu = data.gpu; // double temperature = context.getParameter(AndersenThermostat::Temperature()); // double frequency = context.getParameter(AndersenThermostat::CollisionFrequency()); // double stepSize = context.getIntegrator().getStepSize(); // if (temperature != prevTemp || frequency != prevFrequency || stepSize != prevStepSize) { // // Initialize the GPU parameters. // // gpuSetAndersenThermostatParameters(gpu, (float) temperature, frequency); // gpuSetConstants(gpu); // kGenerateRandoms(gpu); // prevTemp = temperature; // prevFrequency = frequency; // prevStepSize = stepSize; // } // kCalculateAndersenThermostat(gpu); //} // void OpenCLCalcKineticEnergyKernel::initialize(const System& system) { int numParticles = system.getNumParticles(); masses.resize(numParticles); for (int i = 0; i < numParticles; ++i) masses[i] = system.getParticleMass(i); } double OpenCLCalcKineticEnergyKernel::execute(ContextImpl& context) { // We don't currently have a GPU kernel to do this, so we retrieve the velocities and calculate the energy // on the CPU. OpenCLArray& velm = cl.getVelm(); double energy = 0.0; for (size_t i = 0; i < masses.size(); ++i) { mm_float4 v = velm[i]; energy += masses[i]*(v.x*v.x+v.y*v.y+v.z*v.z); } return 0.5*energy; } // //void OpenCLRemoveCMMotionKernel::initialize(const System& system, const CMMotionRemover& force) { // data.removeCM = true; // data.cmMotionFrequency = force.getFrequency(); //} // //void OpenCLRemoveCMMotionKernel::execute(ContextImpl& context) { //}