d8/d59/MGPUMpdRdmeSolver_8h_source.html

/*

 * University of Illinois Open Source License

 * Copyright 2008-2018 Luthey-Schulten Group,

 * Copyright 2012 Roberts Group,

 * All rights reserved.

 *

 * Developed by: Luthey-Schulten Group

 *               University of Illinois at Urbana-Champaign

 *               http://www.scs.uiuc.edu/~schulten

 *

 * Developed by: Roberts Group

 *               Johns Hopkins University

 *               http://biophysics.jhu.edu/roberts/

 *

 * Permission is hereby granted, free of charge, to any person obtaining a copy of

 * this software and associated documentation files (the Software), to deal with

 * the Software without restriction, including without limitation the rights to

 * use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies

 * of the Software, and to permit persons to whom the Software is furnished to

 * do so, subject to the following conditions:

 *

 * - Redistributions of source code must retain the above copyright notice,

 * this list of conditions and the following disclaimers.

 *

 * - Redistributions in binary form must reproduce the above copyright notice,

 * this list of conditions and the following disclaimers in the documentation

 * and/or other materials provided with the distribution.

 *

 * - Neither the names of the Luthey-Schulten Group, University of Illinois at

 * Urbana-Champaign, the Roberts Group, Johns Hopkins University, nor the names

 * of its contributors may be used to endorse or promote products derived from

 * this Software without specific prior written permission.

 *

 * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR

 * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,

 * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT.  IN NO EVENT SHALL

 * THE CONTRIBUTORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR

 * OTHER LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE,

 * ARISING FROM, OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR

 * OTHER DEALINGS WITH THE SOFTWARE.

 *

 * Author(s): Elijah Roberts, Mike Hallock, Zane Thornburg

 */


#ifndef LM_RDME_MGPUMPDRDMESOLVER_H_

#define LM_RDME_MGPUMPDRDMESOLVER_H_


#include "cuda/lm_cuda.h"

#include "core/ResourceAllocator.h"

#include "rdme/RDMESolver.h"

#include "rdme/ByteLattice.h"

#include "rdme/GPUMapper/MultiGPUMapper.h"

#include "rdme/GPUMapper/SegmentDescriptor.h"


#if defined(MACOSX)

#include "GPUMapper/osx_barrier.h"

#endif


#define OVERFLOW_MODE_CLASSIC 0

#define OVERFLOW_MODE_RELAXED 1


using lm::main::ResourceAllocator;

using lm::rdme::RDMESolver;

using lm::rdme::Lattice;


namespace lm {


namespace io {

    class Lattice;

    class SpeciesCounts;

}


namespace rdme {


struct gpu_worker_thread_params;


class MGPUMpdRdmeSolver: public RDMESolver

{

    using CMESolver::hookSimulation;

    using RDMESolver::buildDiffusionModel;


public:

    MGPUMpdRdmeSolver();

    virtual ~MGPUMpdRdmeSolver();


    virtual void initialize(unsigned int replicate,

                            map<string, string>* parameters,

                            ResourceAllocator::ComputeResources* resources);


    virtual bool needsReactionModel()  {return true;}

    virtual bool needsDiffusionModel() {return true;}


    virtual void buildModel(const uint numberSpeciesA,

                            const uint numberReactionsA,

                            const uint* initialSpeciesCountsA,

                            const uint* reactionTypeA,

                            const double* kA,

                            const int* SA,

                            const uint* DA,

                            const uint kCols = 1);


    virtual void buildDiffusionModel(const uint numberSiteTypesA,

                                     const double* DFA,

                                     const uint* RLA,

                                     lattice_size_t latticeXSize,

                                     lattice_size_t latticeYSize,

                                     lattice_size_t latticeZSize,

                                     site_size_t particlesPerSite,

                                     const unsigned int bytes_per_particle,

                                     si_dist_t latticeSpacing,

                                     const uint8_t* latticeData,

                                     const uint8_t* latticeSitesData,

                                     bool rowMajorData = true);


    virtual void generateTrajectory();

    virtual void setReactionRate(unsigned int rxid, float rate);


protected:

    uint32_t seed;

    double tau;

    bool reactionModelModified;


    uint32_t overflowTimesteps;

    uint32_t overflowListUses;

    int      overflow_handling;


    // Stored model parameters for const memory

    unsigned int* model_reactionOrders;

    unsigned int* model_reactionSites;

    float*        model_reactionRates;


    unsigned int* model_D1;

    unsigned int* model_D2;


    int8_t*  model_S;

    float*   model_T;

    uint8_t* model_RL;


    size_t zeroOrderSize, firstOrderSize, secondOrderSize;

    float *zeroOrder, *firstOrder, *secondOrder;


    MultiGPUMapper* mapper;

    ResourceAllocator::ComputeResources* resources;

    gpu_worker_thread_params* threads;

    pthread_barrier_t start_barrier, stop_barrier, simulation_barrier, overflow_barrier;


    int timesteps_to_run;

    uint32_t current_timestep;

    double printPerfInterval;


    bool aggcopy_x_unpack;

    bool aggcopy_r_pack;

    bool use_spin_barrier;


    virtual void allocateLattice(lattice_size_t latticeXSize,

                                 lattice_size_t latticeYSize,

                                 lattice_size_t latticeZSize,

                                 site_size_t particlesPerSite,

                                 const unsigned int bytes_per_particle,

                                 si_dist_t latticeSpacing);


    virtual void writeLatticeData(double time,

                                  ByteLattice* lattice,

                                  lm::io::Lattice* latticeDataSet);

    virtual void writeLatticeSites(double time, ByteLattice* lattice);


    virtual void recordSpeciesCounts(double time,

                                     ByteLattice* lattice,

                                     lm::io::SpeciesCounts* speciesCountsDataSet);

    virtual void writeSpeciesCounts(lm::io::SpeciesCounts* speciesCountsDataSet);


    virtual int hookSimulation(double time, ByteLattice* lattice);

    virtual void hookCheckSimulation(double time, ByteLattice* lattice);


    virtual int run_next_timestep(int gpu, uint32_t timestep);

    virtual uint64_t getTimestepSeed(uint32_t timestep, uint32_t substep);


    virtual void computePropensities();

    virtual void initialize_decomposition();

    virtual void setupModelsOnDevice(int gpu);

    virtual void copyModelsToDevice(int gpu);


    virtual void start_threads();

    virtual void stop_threads();

    virtual void* run_thread(int);

    friend void* gpu_worker_thread(void* arg);


    virtual int handle_all_overflows();

    virtual int handle_overflows(int gpu, void* hptr, void* dptr, int ts);


    virtual void calculateXLaunchParameters(dim3* gridSize, dim3* threadBlockSize,

                                            const unsigned int maxXBlockSize,

                                            const unsigned int latticeXSize,

                                            const unsigned int latticeYSize,

                                            const unsigned int latticeZSize);


    virtual void calculateYLaunchParameters(dim3* gridSize, dim3* threadBlockSize,

                                            const unsigned int blockXSize,

                                            const unsigned int blockYSize,

                                            const unsigned int latticeXSize,

                                            const unsigned int latticeYSize,

                                            const unsigned int latticeZSize);


    virtual void calculateZLaunchParameters(dim3* gridSize, dim3* threadBlockSize,

                                            const unsigned int blockXSize,

                                            const unsigned int blockZSize,

                                            const unsigned int latticeXSize,

                                            const unsigned int latticeYSize,

                                            const unsigned int latticeZSize);


    virtual void calculateReactionLaunchParameters(dim3* gridSize, dim3* threadBlockSize,

                                                   const unsigned int blockXSize,

                                                   const unsigned int blockYSize,

                                                   const unsigned int latticeXSize,

                                                   const unsigned int latticeYSize,

                                                   const unsigned int latticeZSize);

};


struct gpu_worker_thread_params

{

    pthread_t thread;

    MGPUMpdRdmeSolver* runner;

    MultiGPUMapper* mapper;


    int gpu;

    int ngpus;

    int timesteps_to_run;


    // cuda objects

    unsigned int *dLattice, *dLatticeTmp;

    uint8_t* dSites;

    cudaStream_t stream1, stream2;

    unsigned int *h_overflows, *d_overflows;


    // kernel launch params

    dim3 grid_x, grid_y, grid_z, grid_r;

    dim3 threads_x, threads_y, threads_z, threads_r;


    // lattice segment geometry provided by the mapper

    SegmentDescriptor_s* segment;


#ifdef MPD_GLOBAL_S_MATRIX

    uint8_t* RLG; // Device global memory pointer for RL matrix

    int8_t*  SG;  // Device global memory pointer for S matrix

#endif


#ifdef MPD_GLOBAL_T_MATRIX

    float* TG;

#endif


#ifdef MPD_GLOBAL_R_MATRIX

    float*        reactionRatesG;

    unsigned int* reactionOrdersG;

    unsigned int* reactionSitesG;


    unsigned int* D1G;

    unsigned int* D2G;

#endif


    float *propZeroOrder, *propFirstOrder, *propSecondOrder;

};


namespace mgpumpdrdme_dev {

__device__ inline size_t local_to_global(unsigned int x, unsigned int y, unsigned int z);

__device__ inline size_t local_index(unsigned int x, unsigned int y, unsigned int z);

__global__ void correct_overflows_mgpu(unsigned int* lattice, unsigned int* siteOverflowList);


__global__ void MGPU_x_kernel_unpack(const unsigned int* inLattice,

                                     const uint8_t* inSites,

                                     unsigned int* outLattice,

                                     const unsigned int z_start,

                                     const unsigned long long timestepHash,

                                     unsigned int* siteOverflowList,

                                     unsigned int* buf_top,

                                     unsigned int* buf_bot);


__global__ void MGPU_x_kernel(const unsigned int* inLattice,

                              const uint8_t* inSites,

                              unsigned int* outLattice,

                              const unsigned int z_start,

                              const unsigned long long timestepHash,

                              unsigned int* siteOverflowList);


__global__ void MGPU_y_kernel(const unsigned int* inLattice,

                              const uint8_t* inSites,

                              unsigned int* outLattice,

                              const unsigned long long timestepHash,

                              unsigned int* siteOverflowList);


__global__ void MGPU_z_kernel(const unsigned int* inLattice,

                              const uint8_t* inSites,

                              unsigned int* outLattice,

                              const unsigned long long timestepHash,

                              unsigned int* siteOverflowList,

                              const unsigned int z_start);


#ifdef MPD_GLOBAL_S_MATRIX

    #ifdef MPD_GLOBAL_R_MATRIX

        __global__ void MGPU_precomp_reaction_kernel(const unsigned int* inLattice,

                                                     const uint8_t* inSites,

                                                     unsigned int* outLattice,

                                                     const unsigned long long timestepHash,

                                                     unsigned int* siteOverflowList,

                                                     int z_start,

                                                     const __restrict__ int8_t* SG,

                                                     const __restrict__ uint8_t* RLG,

                                                     const unsigned int* __restrict__ reactionOrderG,

                                                     const unsigned int* __restrict__ reactionSitesG,

                                                     const unsigned int* __restrict__ D1G,

                                                     const unsigned int* __restrict__ D2G,

                                                     const float* __restrict__ reactionRatesG,

                                                     const float* __restrict__ qp0,

                                                     const float* __restrict__ qp1,

                                                     const float* __restrict__ qp2);


        __global__ void MGPU_precomp_reaction_kernel_packing(const unsigned int* inLattice,

                                                             const uint8_t* inSites,

                                                             unsigned int* outLattice,

                                                             const unsigned long long timestepHash,

                                                             unsigned int* siteOverflowList,

                                                             int z_start,

                                                             const __restrict__ int8_t* SG,

                                                             const __restrict__ uint8_t* RLG,

                                                             const unsigned int* __restrict__ reactionOrdersG,

                                                             const unsigned int* __restrict__ reactionSitesG,

                                                             const unsigned int* __restrict__ D1G,

                                                             const unsigned int* __restrict__ D2G,

                                                             const float* __restrict__ reactionRatesG,

                                                             const float* __restrict__ qp0,

                                                             const float* __restrict__ qp1,

                                                             const float* __restrict__ qp2,

                                                             unsigned int* buf_top,

                                                             unsigned int* buf_bot);


        __global__ void MGPU_reaction_kernel(const unsigned int* inLattice,

                                             const uint8_t* inSites,

                                             unsigned int* outLattice,

                                             const unsigned long long timestepHash,

                                             unsigned int* siteOverflowList,

                                             const unsigned int z_start,

                                             const int8_t* __restrict__ SG,

                                             const uint8_t* __restrict__ RLG,

                                             const unsigned int* __restrict__ reactionOrdersG,

                                             const unsigned int* __restrict__ reactionSitesG,

                                             const unsigned int* __restrict__ D1G,

                                             const unsigned int* __restrict__ D2G,

                                             const float* __restrict__ reactionRatesG);

    #else

        __global__ void MGPU_precomp_reaction_kernel(const unsigned int* inLattice,

                                                     const uint8_t* inSites,

                                                     unsigned int* outLattice,

                                                     const unsigned long long timestepHash,

                                                     unsigned int* siteOverflowList,

                                                     int z_start,

                                                     const __restrict__ int8_t* SG,

                                                     const __restrict__ uint8_t* RLG,

                                                     const float* __restrict__ qp0,

                                                     const float* __restrict__ qp1,

                                                     const float* __restrict__ qp2);


        __global__ void MGPU_precomp_reaction_kernel_packing(const unsigned int* inLattice,

                                                             const uint8_t* inSites,

                                                             unsigned int* outLattice,

                                                             const unsigned long long timestepHash,

                                                             unsigned int* siteOverflowList,

                                                             int z_start,

                                                             const __restrict__ int8_t* SG,

                                                             const __restrict__ uint8_t* RLG,

                                                             const float* __restrict__ qp0,

                                                             const float* __restrict__ qp1,

                                                             const float* __restrict__ qp2,

                                                             unsigned int* buf_top,

                                                             unsigned int* buf_bot);


        __global__ void MGPU_reaction_kernel(const unsigned int* inLattice,

                                             const uint8_t* inSites,

                                             unsigned int* outLattice,

                                             const unsigned long long timestepHash,

                                             unsigned int* siteOverflowList,

                                             const unsigned int z_start,

                                             const int8_t* __restrict__ SG,

                                             const uint8_t* __restrict__ RLG);

    #endif

#else

    __global__ void MGPU_precomp_reaction_kernel(const unsigned int* inLattice,

                                                 const uint8_t* inSites,

                                                 unsigned int* outLattice,

                                                 const unsigned long long timestepHash,

                                                 unsigned int* siteOverflowList,

                                                 int z_start,

                                                 const float* __restrict__ qp0,

                                                 const float* __restrict__ qp1,

                                                 const float* __restrict__ qp2);


    __global__ void MGPU_precomp_reaction_kernel_packing(const unsigned int* inLattice,

                                                         const uint8_t* inSites,

                                                         unsigned int* outLattice,

                                                         const unsigned long long timestepHash,

                                                         unsigned int* siteOverflowList,

                                                         int z_start,

                                                         const float* __restrict__ qp0,

                                                         const float* __restrict__ qp1,

                                                         const float* __restrict__ qp2,

                                                         unsigned int* buf_top,

                                                         unsigned int* buf_bot);


    __global__ void MGPU_reaction_kernel(const unsigned int* inLattice,

                                         const uint8_t* inSites,

                                         unsigned int* outLattice,

                                         const unsigned long long timestepHash,

                                         unsigned int* siteOverflowList,

                                         const unsigned int z_start);

#endif

}


}

}


#endif

site_size_t
uint32_t site_size_t
Definition ByteLatticeExtended.h:23

ByteLattice.h

lattice_size_t
uint32_t lattice_size_t
Definition Lattice.h:55

MultiGPUMapper.h

RDMESolver.h

ResourceAllocator.h

SegmentDescriptor.h

SegmentDescriptor_s
struct segmentDescriptor SegmentDescriptor_s
Definition SegmentDescriptor.h:57

si_dist_t
double si_dist_t
Definition Types.h:63

uint
unsigned int uint
Definition Types.h:52

CMESolver::hookSimulation
virtual int hookSimulation(double time)
Definition CMESolver.cpp:1242

MultiGPUMapper
Definition MultiGPUMapper.h:50

ResourceAllocator::ComputeResources
A representation for the resources for a given node.
Definition ResourceAllocator.h:62

lm::cme::CMESolver::parameters
map< string, string > * parameters
Definition CMESolver.h:266

lm::cme::CMESolver::replicate
unsigned int replicate
Definition CMESolver.h:265

lm::main::ResourceAllocator
An object that tracks the available resources for the main simulation runner.
Definition ResourceAllocator.h:57

lm::rdme::ByteLattice
A Lattice that is based on packed bytes of memory, i.e. one byte per lattice site to hold particles.
Definition ByteLattice.h:53

lm::rdme::Lattice
Base class for lattice type objects.
Definition Lattice.h:132

lm::rdme::MGPUMpdRdmeSolver
Definition MGPUMpdRdmeSolver.h:78

lm::rdme::MGPUMpdRdmeSolver::run_thread
virtual void * run_thread(int)

lm::rdme::MGPUMpdRdmeSolver::writeLatticeData
virtual void writeLatticeData(double time, ByteLattice *lattice, lm::io::Lattice *latticeDataSet)

lm::rdme::MGPUMpdRdmeSolver::initialize_decomposition
virtual void initialize_decomposition()

lm::rdme::MGPUMpdRdmeSolver::timesteps_to_run
int timesteps_to_run
Definition MGPUMpdRdmeSolver.h:147

lm::rdme::MGPUMpdRdmeSolver::calculateReactionLaunchParameters
virtual void calculateReactionLaunchParameters(dim3 *gridSize, dim3 *threadBlockSize, const unsigned int blockXSize, const unsigned int blockYSize, const unsigned int latticeXSize, const unsigned int latticeYSize, const unsigned int latticeZSize)

lm::rdme::MGPUMpdRdmeSolver::model_T
float * model_T
Definition MGPUMpdRdmeSolver.h:136

lm::rdme::MGPUMpdRdmeSolver::writeLatticeSites
virtual void writeLatticeSites(double time, ByteLattice *lattice)

lm::rdme::MGPUMpdRdmeSolver::secondOrder
float * secondOrder
Definition MGPUMpdRdmeSolver.h:140

lm::rdme::MGPUMpdRdmeSolver::overflowTimesteps
uint32_t overflowTimesteps
Definition MGPUMpdRdmeSolver.h:123

lm::rdme::MGPUMpdRdmeSolver::stop_barrier
pthread_barrier_t stop_barrier
Definition MGPUMpdRdmeSolver.h:145

lm::rdme::MGPUMpdRdmeSolver::buildDiffusionModel
virtual void buildDiffusionModel(const uint numberSiteTypesA, const double *DFA, const uint *RLA, lattice_size_t latticeXSize, lattice_size_t latticeYSize, lattice_size_t latticeZSize, site_size_t particlesPerSite, const unsigned int bytes_per_particle, si_dist_t latticeSpacing, const uint8_t *latticeData, const uint8_t *latticeSitesData, bool rowMajorData=true)

lm::rdme::MGPUMpdRdmeSolver::needsDiffusionModel
virtual bool needsDiffusionModel()
Tells whether the solver needs a reaction model.
Definition MGPUMpdRdmeSolver.h:91

lm::rdme::MGPUMpdRdmeSolver::overflowListUses
uint32_t overflowListUses
Definition MGPUMpdRdmeSolver.h:124

lm::rdme::MGPUMpdRdmeSolver::aggcopy_x_unpack
bool aggcopy_x_unpack
Definition MGPUMpdRdmeSolver.h:151

lm::rdme::MGPUMpdRdmeSolver::copyModelsToDevice
virtual void copyModelsToDevice(int gpu)

lm::rdme::MGPUMpdRdmeSolver::firstOrder
float * firstOrder
Definition MGPUMpdRdmeSolver.h:140

lm::rdme::MGPUMpdRdmeSolver::handle_overflows
virtual int handle_overflows(int gpu, void *hptr, void *dptr, int ts)

lm::rdme::MGPUMpdRdmeSolver::model_RL
uint8_t * model_RL
Definition MGPUMpdRdmeSolver.h:137

lm::rdme::MGPUMpdRdmeSolver::calculateZLaunchParameters
virtual void calculateZLaunchParameters(dim3 *gridSize, dim3 *threadBlockSize, const unsigned int blockXSize, const unsigned int blockZSize, const unsigned int latticeXSize, const unsigned int latticeYSize, const unsigned int latticeZSize)

lm::rdme::MGPUMpdRdmeSolver::overflow_handling
int overflow_handling
Definition MGPUMpdRdmeSolver.h:125

lm::rdme::MGPUMpdRdmeSolver::allocateLattice
virtual void allocateLattice(lattice_size_t latticeXSize, lattice_size_t latticeYSize, lattice_size_t latticeZSize, site_size_t particlesPerSite, const unsigned int bytes_per_particle, si_dist_t latticeSpacing)

lm::rdme::MGPUMpdRdmeSolver::printPerfInterval
double printPerfInterval
Definition MGPUMpdRdmeSolver.h:149

lm::rdme::MGPUMpdRdmeSolver::model_reactionOrders
unsigned int * model_reactionOrders
Definition MGPUMpdRdmeSolver.h:128

lm::rdme::MGPUMpdRdmeSolver::zeroOrder
float * zeroOrder
Definition MGPUMpdRdmeSolver.h:140

lm::rdme::MGPUMpdRdmeSolver::model_reactionSites
unsigned int * model_reactionSites
Definition MGPUMpdRdmeSolver.h:129

lm::rdme::MGPUMpdRdmeSolver::buildModel
virtual void buildModel(const uint numberSpeciesA, const uint numberReactionsA, const uint *initialSpeciesCountsA, const uint *reactionTypeA, const double *kA, const int *SA, const uint *DA, const uint kCols=1)

lm::rdme::MGPUMpdRdmeSolver::seed
uint32_t seed
Definition MGPUMpdRdmeSolver.h:119

lm::rdme::MGPUMpdRdmeSolver::calculateYLaunchParameters
virtual void calculateYLaunchParameters(dim3 *gridSize, dim3 *threadBlockSize, const unsigned int blockXSize, const unsigned int blockYSize, const unsigned int latticeXSize, const unsigned int latticeYSize, const unsigned int latticeZSize)

lm::rdme::MGPUMpdRdmeSolver::hookCheckSimulation
virtual void hookCheckSimulation(double time, ByteLattice *lattice)

lm::rdme::MGPUMpdRdmeSolver::~MGPUMpdRdmeSolver
virtual ~MGPUMpdRdmeSolver()

lm::rdme::MGPUMpdRdmeSolver::model_D2
unsigned int * model_D2
Definition MGPUMpdRdmeSolver.h:133

lm::rdme::MGPUMpdRdmeSolver::reactionModelModified
bool reactionModelModified
Definition MGPUMpdRdmeSolver.h:121

lm::rdme::MGPUMpdRdmeSolver::zeroOrderSize
size_t zeroOrderSize
Definition MGPUMpdRdmeSolver.h:139

lm::rdme::MGPUMpdRdmeSolver::stop_threads
virtual void stop_threads()

lm::rdme::MGPUMpdRdmeSolver::recordSpeciesCounts
virtual void recordSpeciesCounts(double time, ByteLattice *lattice, lm::io::SpeciesCounts *speciesCountsDataSet)

lm::rdme::MGPUMpdRdmeSolver::hookSimulation
virtual int hookSimulation(double time, ByteLattice *lattice)

lm::rdme::MGPUMpdRdmeSolver::start_barrier
pthread_barrier_t start_barrier
Definition MGPUMpdRdmeSolver.h:145

lm::rdme::MGPUMpdRdmeSolver::run_next_timestep
virtual int run_next_timestep(int gpu, uint32_t timestep)

lm::rdme::MGPUMpdRdmeSolver::current_timestep
uint32_t current_timestep
Definition MGPUMpdRdmeSolver.h:148

lm::rdme::MGPUMpdRdmeSolver::model_D1
unsigned int * model_D1
Definition MGPUMpdRdmeSolver.h:132

lm::rdme::MGPUMpdRdmeSolver::model_S
int8_t * model_S
Definition MGPUMpdRdmeSolver.h:135

lm::rdme::MGPUMpdRdmeSolver::firstOrderSize
size_t firstOrderSize
Definition MGPUMpdRdmeSolver.h:139

lm::rdme::MGPUMpdRdmeSolver::setupModelsOnDevice
virtual void setupModelsOnDevice(int gpu)

lm::rdme::MGPUMpdRdmeSolver::gpu_worker_thread
friend void * gpu_worker_thread(void *arg)

lm::rdme::MGPUMpdRdmeSolver::use_spin_barrier
bool use_spin_barrier
Definition MGPUMpdRdmeSolver.h:153

lm::rdme::MGPUMpdRdmeSolver::initialize
virtual void initialize(unsigned int replicate, map< string, string > *parameters, ResourceAllocator::ComputeResources *resources)
Initialize the simulation.

lm::rdme::MGPUMpdRdmeSolver::MGPUMpdRdmeSolver
MGPUMpdRdmeSolver()

lm::rdme::MGPUMpdRdmeSolver::writeSpeciesCounts
virtual void writeSpeciesCounts(lm::io::SpeciesCounts *speciesCountsDataSet)

lm::rdme::MGPUMpdRdmeSolver::model_reactionRates
float * model_reactionRates
Definition MGPUMpdRdmeSolver.h:130

lm::rdme::MGPUMpdRdmeSolver::start_threads
virtual void start_threads()

lm::rdme::MGPUMpdRdmeSolver::overflow_barrier
pthread_barrier_t overflow_barrier
Definition MGPUMpdRdmeSolver.h:145

lm::rdme::MGPUMpdRdmeSolver::needsReactionModel
virtual bool needsReactionModel()
Tells whether the solver needs a reaction model.
Definition MGPUMpdRdmeSolver.h:90

lm::rdme::MGPUMpdRdmeSolver::aggcopy_r_pack
bool aggcopy_r_pack
Definition MGPUMpdRdmeSolver.h:152

lm::rdme::MGPUMpdRdmeSolver::handle_all_overflows
virtual int handle_all_overflows()

lm::rdme::MGPUMpdRdmeSolver::calculateXLaunchParameters
virtual void calculateXLaunchParameters(dim3 *gridSize, dim3 *threadBlockSize, const unsigned int maxXBlockSize, const unsigned int latticeXSize, const unsigned int latticeYSize, const unsigned int latticeZSize)

lm::rdme::MGPUMpdRdmeSolver::mapper
MultiGPUMapper * mapper
Definition MGPUMpdRdmeSolver.h:142

lm::rdme::MGPUMpdRdmeSolver::resources
ResourceAllocator::ComputeResources * resources
Definition MGPUMpdRdmeSolver.h:143

lm::rdme::MGPUMpdRdmeSolver::threads
gpu_worker_thread_params * threads
Definition MGPUMpdRdmeSolver.h:144

lm::rdme::MGPUMpdRdmeSolver::simulation_barrier
pthread_barrier_t simulation_barrier
Definition MGPUMpdRdmeSolver.h:145

lm::rdme::MGPUMpdRdmeSolver::generateTrajectory
virtual void generateTrajectory()
Actually run the simulation.

lm::rdme::MGPUMpdRdmeSolver::secondOrderSize
size_t secondOrderSize
Definition MGPUMpdRdmeSolver.h:139

lm::rdme::MGPUMpdRdmeSolver::getTimestepSeed
virtual uint64_t getTimestepSeed(uint32_t timestep, uint32_t substep)

lm::rdme::MGPUMpdRdmeSolver::setReactionRate
virtual void setReactionRate(unsigned int rxid, float rate)

lm::rdme::MGPUMpdRdmeSolver::computePropensities
virtual void computePropensities()

lm::rdme::MGPUMpdRdmeSolver::tau
double tau
Definition MGPUMpdRdmeSolver.h:120

lm::rdme::RDMESolver
Definition RDMESolver.h:55

lm::rdme::RDMESolver::lattice
Lattice * lattice
Definition RDMESolver.h:73

lm::rdme::RDMESolver::buildDiffusionModel
virtual void buildDiffusionModel(const uint numberSiteTypesA, const double *DFA, const uint *RLA, lattice_size_t latticeXSize, lattice_size_t latticeYSize, lattice_size_t latticeZSize, site_size_t particlesPerSite, const unsigned int bytes_per_particle, si_dist_t latticeSpacing, const uint8_t *latticeData, const uint8_t *latticeSitesData, bool rowMajorData=true)
Definition RDMESolver.cpp:110

lm::rdme::RDMESolver::RDMESolver
RDMESolver(RandomGenerator::Distributions neededDists)
Definition RDMESolver.cpp:58

lm_cuda.h

lm::rdme::mgpumpdrdme_dev
Definition MGPUMpdRdmeSolver.h:264

lm::rdme::mgpumpdrdme_dev::MGPU_x_kernel_unpack
__global__ void MGPU_x_kernel_unpack(const unsigned int *inLattice, const uint8_t *inSites, unsigned int *outLattice, const unsigned int z_start, const unsigned long long timestepHash, unsigned int *siteOverflowList, unsigned int *buf_top, unsigned int *buf_bot)

lm::rdme::mgpumpdrdme_dev::local_index
__device__ size_t local_index(unsigned int x, unsigned int y, unsigned int z)

lm::rdme::mgpumpdrdme_dev::MGPU_z_kernel
__global__ void MGPU_z_kernel(const unsigned int *inLattice, const uint8_t *inSites, unsigned int *outLattice, const unsigned long long timestepHash, unsigned int *siteOverflowList, const unsigned int z_start)

lm::rdme::mgpumpdrdme_dev::local_to_global
__device__ size_t local_to_global(unsigned int x, unsigned int y, unsigned int z)

lm::rdme::mgpumpdrdme_dev::MGPU_reaction_kernel
__global__ void MGPU_reaction_kernel(const unsigned int *inLattice, const uint8_t *inSites, unsigned int *outLattice, const unsigned long long timestepHash, unsigned int *siteOverflowList, const unsigned int z_start)

lm::rdme::mgpumpdrdme_dev::MGPU_precomp_reaction_kernel_packing
__global__ void MGPU_precomp_reaction_kernel_packing(const unsigned int *inLattice, const uint8_t *inSites, unsigned int *outLattice, const unsigned long long timestepHash, unsigned int *siteOverflowList, int z_start, const float *__restrict__ qp0, const float *__restrict__ qp1, const float *__restrict__ qp2, unsigned int *buf_top, unsigned int *buf_bot)

lm::rdme::mgpumpdrdme_dev::correct_overflows_mgpu
__global__ void correct_overflows_mgpu(unsigned int *lattice, unsigned int *siteOverflowList)

lm::rdme::mgpumpdrdme_dev::MGPU_precomp_reaction_kernel
__global__ void MGPU_precomp_reaction_kernel(const unsigned int *inLattice, const uint8_t *inSites, unsigned int *outLattice, const unsigned long long timestepHash, unsigned int *siteOverflowList, int z_start, const float *__restrict__ qp0, const float *__restrict__ qp1, const float *__restrict__ qp2)

lm::rdme::mgpumpdrdme_dev::MGPU_y_kernel
__global__ void MGPU_y_kernel(const unsigned int *inLattice, const uint8_t *inSites, unsigned int *outLattice, const unsigned long long timestepHash, unsigned int *siteOverflowList)

lm::rdme::mgpumpdrdme_dev::MGPU_x_kernel
__global__ void MGPU_x_kernel(const unsigned int *inLattice, const uint8_t *inSites, unsigned int *outLattice, const unsigned int z_start, const unsigned long long timestepHash, unsigned int *siteOverflowList)

lm
Definition Capsule.cpp:46

osx_barrier.h

lm::rdme::gpu_worker_thread_params
Definition MGPUMpdRdmeSolver.h:220

lm::rdme::gpu_worker_thread_params::threads_z
dim3 threads_z
Definition MGPUMpdRdmeSolver.h:237

lm::rdme::gpu_worker_thread_params::dLattice
unsigned int * dLattice
Definition MGPUMpdRdmeSolver.h:230

lm::rdme::gpu_worker_thread_params::threads_x
dim3 threads_x
Definition MGPUMpdRdmeSolver.h:237

lm::rdme::gpu_worker_thread_params::segment
SegmentDescriptor_s * segment
Definition MGPUMpdRdmeSolver.h:240

lm::rdme::gpu_worker_thread_params::propZeroOrder
float * propZeroOrder
Definition MGPUMpdRdmeSolver.h:260

lm::rdme::gpu_worker_thread_params::grid_y
dim3 grid_y
Definition MGPUMpdRdmeSolver.h:236

lm::rdme::gpu_worker_thread_params::d_overflows
unsigned int * d_overflows
Definition MGPUMpdRdmeSolver.h:233

lm::rdme::gpu_worker_thread_params::threads_y
dim3 threads_y
Definition MGPUMpdRdmeSolver.h:237

lm::rdme::gpu_worker_thread_params::mapper
MultiGPUMapper * mapper
Definition MGPUMpdRdmeSolver.h:223

lm::rdme::gpu_worker_thread_params::h_overflows
unsigned int * h_overflows
Definition MGPUMpdRdmeSolver.h:233

lm::rdme::gpu_worker_thread_params::grid_x
dim3 grid_x
Definition MGPUMpdRdmeSolver.h:236

lm::rdme::gpu_worker_thread_params::timesteps_to_run
int timesteps_to_run
Definition MGPUMpdRdmeSolver.h:227

lm::rdme::gpu_worker_thread_params::gpu
int gpu
Definition MGPUMpdRdmeSolver.h:225

lm::rdme::gpu_worker_thread_params::threads_r
dim3 threads_r
Definition MGPUMpdRdmeSolver.h:237

lm::rdme::gpu_worker_thread_params::thread
pthread_t thread
Definition MGPUMpdRdmeSolver.h:221

lm::rdme::gpu_worker_thread_params::propSecondOrder
float * propSecondOrder
Definition MGPUMpdRdmeSolver.h:260

lm::rdme::gpu_worker_thread_params::grid_r
dim3 grid_r
Definition MGPUMpdRdmeSolver.h:236

lm::rdme::gpu_worker_thread_params::ngpus
int ngpus
Definition MGPUMpdRdmeSolver.h:226

lm::rdme::gpu_worker_thread_params::dSites
uint8_t * dSites
Definition MGPUMpdRdmeSolver.h:231

lm::rdme::gpu_worker_thread_params::propFirstOrder
float * propFirstOrder
Definition MGPUMpdRdmeSolver.h:260

lm::rdme::gpu_worker_thread_params::runner
MGPUMpdRdmeSolver * runner
Definition MGPUMpdRdmeSolver.h:222

lm::rdme::gpu_worker_thread_params::grid_z
dim3 grid_z
Definition MGPUMpdRdmeSolver.h:236

lm::rdme::gpu_worker_thread_params::stream2
cudaStream_t stream2
Definition MGPUMpdRdmeSolver.h:232

lm::rdme::gpu_worker_thread_params::dLatticeTmp
unsigned int * dLatticeTmp
Definition MGPUMpdRdmeSolver.h:230

lm::rdme::gpu_worker_thread_params::stream1
cudaStream_t stream1
Definition MGPUMpdRdmeSolver.h:232