Riucc's Storage
RSS
태그
관리
쓰기
카테고리
  • IT (593)
    • 정리 (0)
    • C# (42)
    • ASP.NET MVC (16)
    • JQuery&Javascript (12)
    • CSS (11)
    • 데이터베이스 (32)
    • Windows Server (6)
    • Active Directory (3)
    • Exchange (9)
    • JAVA (2)
    • JSP (39)
    • JSP 게시판 만들기 (21)
    • JSP 개발 참고 (15)
    • JSP 안드로이드 (4)
    • Servlet (17)
    • Spring (42)
    • HTML (14)
    • NodeJS (46)
    • MongoDB (11)
    • 리눅스 (18)
    • 자료구조 (16)
    • 아이폰 (24)
    • 안드로이드 (68)
    • API 활용하기 (10)
    • 소켓네트워크 (28)
    • 라즈베리파이 (11)
    • AWS클라우드 (10)
    • 빅데이터Hadoop (22)
    • 커널모듈프로그래밍 (8)
    • 기타 (10)
    • 자격증 (26)
Riucc's Storage

[Hadoop] - 피그(pig) 예제 : passwd 파일 데이터 추출하기

빅데이터Hadoop|2017. 6. 27. 14:54
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

 ○ 피그(pig) 예제 : passwd 파일 데이터 추출하기

 

1. vi /etc/passwd 파일을 열어보자

    열어보면 각종 아이디 패스워드 UID GID 사용자이름 홈디렉토리가 쭈욱 나열되어 있다


2. /etc/passwd 파일을 hdfs의 /user/cloudera 에 passex 로 업로드한다

3. 피그의 grunt shell을 실행한다


4. a1 으로 해당 파일을 불러오고 using PigStorage 의 : 을 구분자로 지정한다

    그리고 result 에다가 foreach로 반복문을 돌면서 첫번째값, 두번째값, 다섯번째값, 여섯번째값을 저장하고

    dump 를 통해 잘 처리되었나 확인을 해본다


5. 해당 result 결과들을 store 명령어를 통해 파일 시스템에 폴더를 만들어 저장하고

    quit 로 나온다


6. 해당 폴더에서 결과를 확인한다


또 다른 예로 / 으로 구분자를 설정했을 때


'빅데이터Hadoop' 카테고리의 다른 글

[Hadoop] - 하이브(hive) 예제 : 강남구 미세먼지 다루기  (0) 2017.06.28
[Hadoop] - 공공데이터 활용하여 분석해보기  (0) 2017.06.28
[Hadoop] - 맵리듀스(MapReduce) 예제 : Word Count  (0) 2017.06.27
[Hadoop] - HDFS + Hue UI 사용하기  (0) 2017.06.27
[Hadoop] - 클라우데라 QuickStart VMs 설치하기  (0) 2017.06.27

댓글()
카테고리
  • IT (593)
    • 정리 (0)
    • C# (42)
    • ASP.NET MVC (16)
    • JQuery&Javascript (12)
    • CSS (11)
    • 데이터베이스 (32)
    • Windows Server (6)
    • Active Directory (3)
    • Exchange (9)
    • JAVA (2)
    • JSP (39)
    • JSP 게시판 만들기 (21)
    • JSP 개발 참고 (15)
    • JSP 안드로이드 (4)
    • Servlet (17)
    • Spring (42)
    • HTML (14)
    • NodeJS (46)
    • MongoDB (11)
    • 리눅스 (18)
    • 자료구조 (16)
    • 아이폰 (24)
    • 안드로이드 (68)
    • API 활용하기 (10)
    • 소켓네트워크 (28)
    • 라즈베리파이 (11)
    • AWS클라우드 (10)
    • 빅데이터Hadoop (22)
    • 커널모듈프로그래밍 (8)
    • 기타 (10)
    • 자격증 (26)
최근 등록 현황
최근 글
최근 월별 글
최근 댓글
최근 글
최근 월별 글
최근 댓글
최근 글
최근 월별 글
최근 댓글
달력
지난달
2026.4
다음달
일월화수목금토
1234
567891011
12131415161718
19202122232425
2627282930
태그 구름
  • 카카오 로그인
  • 이클립스 mysql 연동
  • 정보처리산업기사 15년 필기
  • 정보처리산업기사 16년
  • 커널 모듈 프로그래밍
  • 정보처리산업기사 총정리
  • 안드로이드 intent
  • 정보처리기사 실기 정리
  • nodejs express
  • nodejs MySQL 연동하기(Connection Pool)
  • 이클립스 디비 연동
  • 정보처리산업기사 15년
  • 정보처리산업기사 16년 필기
  • 정규형
  • HTML
  • 정보처리산업기사 정리
  • 소켓
  • 안드로이드
  • 데이터베이스
  • 카카오 로그인 연동
  • 안드로이드 카카오 로그인
  • 소켓 프로그래밍
  • 정보처리산업기사 요약
  • 안드로이드 카카오 로그인 연동
  • 리눅스
  • 정보처리산업기사 필기 정리
  • jsp
  • 정보처리산업기사 필기
  • 자료구조
  • 정규화
카운터
전체 방문자
오늘
어제
Skin by M1REACT. Designed by M1STORY.TISTORY.COM. Valid XHTML 1.0 and CSS 3. Copyright ⓒ Riucc's Storage. All rights reserved.

티스토리툴바