Hierarchy

    Thread Hierarchy, CUDA Kernel

    💡 Thread Hierarchy 커널 함수가 호스트에서 호출될 때, 많은 수의 스레드가 생성됨 스레드 계층 구조는 스레드 블록과 그리드로 구성됨 어떤 스레드가 어떤 데이터를 처리할지 인덱싱을 해주는게 프로그래머가 해야할 역할임 그리드와 스레드 블록의 크기는 두 개의 built-in 변수를 이용하여 구할 수 있음 gridDim:그리드 크기(그리드 내의 블록의 수), gridDim.x, gridDim.y, grindDim.z blockDim: 블록의 크기(블록 내의 스레드의 수), blockDim.x, blockDim.y, blockDim.z blockIdx: 그리드 내에서 블록 인덱스 threadIdx: 블록 내에서 스레드 인덱스 데이터의 개수=스레드의 개수= 블록의 크기 * 그리드의 크기 나누어 떨어지..