[Hadoop] - 피그(pig) 예제 : passwd 파일 데이터 추출하기
빅데이터Hadoop2017. 6. 27. 14:54
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.
○ 피그(pig) 예제 : passwd 파일 데이터 추출하기 |
1. vi /etc/passwd 파일을 열어보자 열어보면 각종 아이디 패스워드 UID GID 사용자이름 홈디렉토리가 쭈욱 나열되어 있다 2. /etc/passwd 파일을 hdfs의 /user/cloudera 에 passex 로 업로드한다 3. 피그의 grunt shell을 실행한다 4. a1 으로 해당 파일을 불러오고 using PigStorage 의 : 을 구분자로 지정한다 그리고 result 에다가 foreach로 반복문을 돌면서 첫번째값, 두번째값, 다섯번째값, 여섯번째값을 저장하고 dump 를 통해 잘 처리되었나 확인을 해본다 5. 해당 result 결과들을 store 명령어를 통해 파일 시스템에 폴더를 만들어 저장하고 quit 로 나온다 6. 해당 폴더에서 결과를 확인한다 또 다른 예로 / 으로 구분자를 설정했을 때 |
'빅데이터Hadoop' 카테고리의 다른 글
[Hadoop] - 하이브(hive) 예제 : 강남구 미세먼지 다루기 (0) | 2017.06.28 |
---|---|
[Hadoop] - 공공데이터 활용하여 분석해보기 (0) | 2017.06.28 |
[Hadoop] - 맵리듀스(MapReduce) 예제 : Word Count (0) | 2017.06.27 |
[Hadoop] - HDFS + Hue UI 사용하기 (0) | 2017.06.27 |
[Hadoop] - 클라우데라 QuickStart VMs 설치하기 (0) | 2017.06.27 |
댓글()