hadoop Secondary Sort ( 보조 정렬 )

Notice

Recent Posts

Tags more

Archives

관리 메뉴

DBILITY

bigdata/hadoop

DBILITY 2016. 12. 6. 17:37

HDFS
　└ INPUTFORMAT

　　　　　└ SPLITS

　　　　　　　└ RECORDREADER

　　　　　　　　　　　└ MAP

　　　　　　　　　　　　　└ COMBINER

　　　　　　　　　　　　　　　　└ PARTITIONER

　　　　　　　　　　　　　　　　　　　　└ SHUFFLE & SORT

　　　　　　　　　　　　　　　　　　　　　　　　└ REDUCE

　　　　　　　　　　　　　　　　　　　　　　　　　　　└ RECORDWRITER

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　└ OUTPUTFORMAT

맵리듀스(MapReduce)는 기본적으로 입력 데이터의 Key를 기준으로 정렬한다.
네트워크를 통한 Shuffle 과정을 통해 Mapper의 출력 데이터를 key로 정렬하면서 동일 key를 갖는 value들끼리 묶는다.
이때 정렬 알고리즘을 적용할 수 있습니다.

참고 서적 : 시작하세요! 하둡프로그래밍 개정 2판(위키북스) - 정재화 지음

hadoop secondary sort and multiple outputs exercise (0)	2017.02.08
hadoop secondary sort exercise ( 보조 정렬 실습 ) (0)	2017.02.06
입력한 공항을 도착지로 년도별 최대 지연 도착 항공편 구하기 (0)	2016.11.30
hadoop job list, kill (0)	2016.11.30
성별,연령대별 최고연봉 구하기 (0)	2016.11.29

공유하기 링크

'bigdata/hadoop' Related Articles

Comments