Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- GIT
- MSSQL
- react
- Python
- IntelliJ
- xPlatform
- R
- Spring
- hadoop
- Java
- SPC
- vaadin
- plugin
- window
- Kotlin
- mapreduce
- 공정능력
- SQL
- Sqoop
- mybatis
- NPM
- 보조정렬
- JavaScript
- tomcat
- Android
- es6
- Express
- table
- SSL
- Eclipse
Archives
- Today
- Total
DBILITY
hadoop Secondary Sort ( 보조 정렬 ) 본문
반응형
HDFS
└ INPUTFORMAT
└ SPLITS
└ RECORDREADER
└ MAP
└ COMBINER
└ PARTITIONER
└ SHUFFLE & SORT
└ REDUCE
└ RECORDWRITER
└ OUTPUTFORMAT
맵리듀스(MapReduce)는 기본적으로 입력 데이터의 Key를 기준으로 정렬한다.
네트워크를 통한 Shuffle 과정을 통해 Mapper의 출력 데이터를 key로 정렬하면서 동일 key를 갖는 value들끼리 묶는다.
이때 정렬 알고리즘을 적용할 수 있습니다.
- 보조정렬 ( Secondary Sort )
키의 값들을 그룹핑하고, 그룹핑된 레코드에 순서를 부여하는 방식
① WritableComparable Interface를 구현한 복합 키(Composite Key)를 정의, 키값 중 어떤 키를 그룹핑 키로 사용할지 결정(복합 키 정의).
② SortComparator는 WritableComparator를 상속하여 복합 키를 기준으로 Record 정렬하도록 구현(복합 키 레코드 정렬, 멤버 변수의 타입에 유의).
③ GroupKeyPartitioner는 Partitioner를 상속하여 그룹핑 키로 파티셔닝 되도록 구현(그룹핑 키 파티셔닝).
④ GroupingComparator는 WritableComparetor를 상속하여 복합 키 중 그룹핑 키를 비교하고, 그룹핑 키를 정렬하도록 구현(그룹핑 키 비교기).
참고 서적 : 시작하세요! 하둡프로그래밍 개정 2판(위키북스) - 정재화 지음
반응형
'bigdata > hadoop' 카테고리의 다른 글
hadoop secondary sort and multiple outputs exercise (0) | 2017.02.08 |
---|---|
hadoop secondary sort exercise ( 보조 정렬 실습 ) (0) | 2017.02.06 |
입력한 공항을 도착지로 년도별 최대 지연 도착 항공편 구하기 (0) | 2016.11.30 |
hadoop job list, kill (0) | 2016.11.30 |
성별,연령대별 최고연봉 구하기 (0) | 2016.11.29 |
Comments