Lab/CUDA
2019. 7. 9.
[Cuda + MPI] 행렬 곱셈 구현 하기
Cuda와 MPI환경을 구축하고 행렬 곱셈을 구현한 소스 코드이다. Cuda와 MPI을 함께 컴파일 하기 위해선 Cuda(nvcc)와 MPI(mpic++)을 사용하는 방법도 있지만 함께 있을땐 cuda컴파일러에 mpi라이브러리를 참조해주면 된다. 방법은 아래와 같다. $ nvcc time_v1.cu -o time_v1 -lmpi #include #include #include #include MPI_Status status; __global__ void matrixMul(float* MatA, float* MatB, float* MatC, int arr_size, int start_range, int end_range) { int i = threadIdx.x; int j = blockIdx.x; if(s..