지난글
- HOWTO #1 : OpenMP를 이용한 멀티 쓰레드 프로그래밍 HOWTO #1
- HOWTO #2 : OpenMP를 이용한 멀티 쓰레드 프로그래밍 HOWTO #2
- HOWTO #3 : OpenMP를 이용한 멀티 쓰레드 프로그래밍 HOWTO #3
- HOWTO #4 : OpenMP를 이용한 멀티 쓰레드 프로그래밍 HOWTO #4
목차
0. 시작하기에 앞서
1. OpenMP란?
2. OpenMP의 시작
3. OpenMP를 이용한 work-sharing 모델
4. Loop construct
4.a Loop consturct 기본 형태
4.b 병렬 처리시 주의점
4.c 스케줄링
* 연습문제 (멀티 쓰레딩과 reentrant 함수의 관계에 대한 문제)
5. Section construct
* 연습문제 (섹션별로 task를 할당하는 방법)
6. Single Construct
7. Master Construct
8. Barrier
8.a Implicit barrier
8.b Explicit barrier
9. critical & atomic construct
9.a critical construct
9.b atomic construct
10. OpenMP API
11. OpenMP에서 제공하는 환경변수 및 전처리기
12. OpenMP vs pthread (POSIX thread)
13. 마치면서
6. Single Constructsingle construct로 지시된 구간은 단 한번만 실행된다. 실행되는 쓰레드는 여러 쓰레드중에 제일 먼저 진입하는 쓰레드이다.
- single construct는 처음으로 진입한 쓰레드가 실행한다.
- 나머지 쓰레드들은 single construct 끝에 존재하는 implicit barrier에서 대기한다.
- single construct가 끝나고 모든 쓰레드들은 implicit barrier에서 동시에 시작한다.
그림에서 보이듯이 parallel 구간에서 쓰레드들 중에 한 개만 single construct를 실행하고 나머지는 뒤에 존재하는 implicit barrier에서 대기하는 것을 볼 수 있다. 그러면 위 소스코드를 컴파일하고 실행해보자. 실행결과는 예상대로 "1. Hello world"는 1번 출력되고, "2. Hello world"는 2번 실행된다.(테스트 호스트는 듀얼 코어이므로)
$ gcc -o omp_single -fopenmp omp_single.c $ ./omp_single 1. Hello world 2. Hello world 2. Hello world |
7. Master Constructmaster construct는 single construct와 매우 비슷하다.
하지만 다른 점이 2가지 있다.
- master construct 구간은 무조건 master thread (main thread)가 1번 실행한다.
- master construct 구간뒤에 implicit barrier가 없다.
즉 모든 쓰레드는 master construct 실행되는 동안에도 계속 실행한다.
8. Barrier배리어란 동기화(synchronization)을 위해서 사용되는 기능이다.
동기화는 시간적 개념이다. 풀어서 설명하기 위해 예를 들자. 스타크래프트 배틀넷은 왠만한 사람이면 다 해봤을 것이다. 최대 8명까지 게임에 참가할 수 있는데, 어떤 유저가 매우 느린 모뎀을 쓰고 있으면 게임 중간에 타임을 세는 화면이 뜨고 기다려주는 것을 볼 수 있다. 이는 빠른 네트워크/컴퓨터를 가진 유저와 느린 네트워크/컴퓨터를 가진 유저의 게임 속도를 맞추기 위해서 배리어가 작동한 것이다. 따라서 결과적으로 배리어는 느린 사람에 맞춰서 앞서 가는 사람이 대기하도록 하는 기능이다.
그러면 프로그래밍에서는 배리어를 어떻게 사용해야 하는가? 작업이 병렬적으로 이뤄진다고 하더라도 전처리, 후처리 작업들이 나눠져 있을 경우에는 전처리 작업들을 병렬처리했을때 어떤 특정 쓰레드가 빨리 처리했다고 후처리 작업을 먼저 출발하면 데이터가 꼬이거나 로직이 망가질 수 있다. 이럴 경우 중간중간에 적절한 배리어를 넣어주면 깔끔하게 해결된다.(하지만 역으로 배리어가 많으면 그 만큼 대기도 많아질 수 있다.)
8.a Implicit barrier
앞에서 implicit barrier(암묵적 배리어)에 대해서 이야기를 많이 했다. OpenMP는 각 작업의 동기화에 대한 편의성을 제공하기 위해서 implicit barrier를 잘 제공한다. 어떤 construct 에 대해서 implicit barrier가 제공되는지 정리하고 넘어가자.
- #pragma omp for
- #pragma omp sections
- #pragma omp single
위의 예제에서는 single construct에 nowait를 적용하여 implicit barrier를 제거하는 것을 볼 수 있다.
(그림 아래에 있는 implicit barrier는 parallel construct에 있는 barrier다.)
8.b Explicit barrier
이번에는 사용자가 직접 지정할 수 있는 explicit barrier 기능에 대해서 보겠습니다.
- #pragma omp barrier 구문을 지정하면 해당 부분에서 모든 쓰레드가 도착할 때까지 대기하게 된다.
이제 실행해보면 배리어 효과때문에 마지막 실행한 19:12:28에서 5초뒤에 phase2가 실행되는 것을 볼 수 있다.
char * get_time0(char *buf, size_t sz_buf);
int main(){int t_sleep; char buf[16];#pragma omp parallel private(t_sleep, buf){#pragma omp single nowaitsleep(1);printf("[%s] phase1:sleep %ld sec.\n", get_time0(buf, sizeof(buf)), t_sleep = times(NULL) % 8);sleep(t_sleep);#pragma omp barrier/* -explicit barrier- */printf("[%s] phase2. Hello world\n", get_time0(buf, sizeof(buf)));}return 0;}char * get_time0(char *buf, size_t sz_buf){time_t t0; struct tm tm_now;if (buf == NULL) return NULL;if (time(&t0) == ((time_t)-1)) return NULL;localtime_r(&t0, &tm_now);if (strftime(buf, sz_buf, "%H:%M:%S", &tm_now) == 0) return NULL;return buf;}
$ ./omp_barrier [19:12:27] phase1:sleep 1 sec. [19:12:28] phase1:sleep 5 sec. [19:12:33] phase2. Hello world [19:12:33] phase2. Hello world |
이번에는 여기까지 마치고, 다음에 critical section이나 atomic, OpenMP API함수등에 대해서 다뤄보도록 하겠다.
원문 : http://sunyzero.egloos.com/4234766
댓글 없음:
댓글 쓰기