Notice
Recent Posts
Recent Comments
Link
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 |
Tags
- es6
- SQL
- SSL
- Python
- IntelliJ
- vaadin
- Express
- Eclipse
- 공정능력
- SPC
- mapreduce
- mybatis
- xPlatform
- react
- window
- MSSQL
- Spring
- tomcat
- Java
- R
- hadoop
- JavaScript
- Kotlin
- 보조정렬
- NPM
- plugin
- GIT
- Android
- Sqoop
- table
Archives
- Today
- Total
반응형
목록2017/02/16 (1)
DBILITY
hadoop partial sort exercise ( 부분 정렬 실습 )
부분정렬(Partial Sort)은 매퍼출력을 MapFile로 변경해 데이터를 검색하는 방법이다. 맵태스크 실행시 파티셔너는 매퍼의 출력데이터가 전달될 리듀서를 결정하고,파티셔닝된 데이터는 키에 따라 정렬된다. 특정키에 대한 데이터 검색시 키가 저장된 맴파일에 접근해 조회한다. 부분정렬 3단계는 아래와 같다. 1.입력데이터를 시퀀스파일로 생성 2.시퀀스파일을 맵파일로 변경 3.맵파일에서 데이터 검색 ※ org.apache.hadoop.mapred 패키지를 사용해 작성해야 함. 다음은 윈도우 환경 Eclipse상에서 테스트 되었습니다. package com.dbility.hadoop.execise; import java.io.IOException; import org.apache.hadoop.conf.Co..
bigdata/hadoop
2017. 2. 16. 20:12
반응형