Riucc's Storage
RSS
태그
관리
쓰기
카테고리
  • IT (593)
    • 정리 (0)
    • C# (42)
    • ASP.NET MVC (16)
    • JQuery&Javascript (12)
    • CSS (11)
    • 데이터베이스 (32)
    • Windows Server (6)
    • Active Directory (3)
    • Exchange (9)
    • JAVA (2)
    • JSP (39)
    • JSP 게시판 만들기 (21)
    • JSP 개발 참고 (15)
    • JSP 안드로이드 (4)
    • Servlet (17)
    • Spring (42)
    • HTML (14)
    • NodeJS (46)
    • MongoDB (11)
    • 리눅스 (18)
    • 자료구조 (16)
    • 아이폰 (24)
    • 안드로이드 (68)
    • API 활용하기 (10)
    • 소켓네트워크 (28)
    • 라즈베리파이 (11)
    • AWS클라우드 (10)
    • 빅데이터Hadoop (22)
    • 커널모듈프로그래밍 (8)
    • 기타 (10)
    • 자격증 (26)
Riucc's Storage

[Hadoop] - 공공데이터 활용하여 분석해보기

빅데이터Hadoop|2017. 6. 28. 13:15
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.

 ○ 공공데이터 활용하여 분석해보기 


공공데이터 다운로드 주소 : http://opendata.hira.or.kr/op/opc/selectOpenDataList.do


여기서 대장암 환자의 신장, 체중자료(2012~2013) 2만건 정도의 데이터를 분석해보았다



1. 필요한 데이터인 나이, 성별, 키, 체중만을 pig를 이용하여 뽑는다



2. 얻은 데이터를 MapReduce 하여 통계를 낸다



3. 해당 결과를 확인해서 분석해보면 12~13 2년동안 남자가 여자보다 대장암에 많이 걸린 사실을 알 수 있고 

    특정 키와 특정 몸무게 값의 수치들을 보면 뚱뚱한 사람이 꼭 대장암이 많이 걸린다고는 할 수 없다는 사실을 알 수 있다.


'빅데이터Hadoop' 카테고리의 다른 글

[Hadoop] - HBase Shell 사용하기  (0) 2017.07.03
[Hadoop] - 하이브(hive) 예제 : 강남구 미세먼지 다루기  (0) 2017.06.28
[Hadoop] - 피그(pig) 예제 : passwd 파일 데이터 추출하기  (0) 2017.06.27
[Hadoop] - 맵리듀스(MapReduce) 예제 : Word Count  (0) 2017.06.27
[Hadoop] - HDFS + Hue UI 사용하기  (0) 2017.06.27

댓글()
카테고리
  • IT (593)
    • 정리 (0)
    • C# (42)
    • ASP.NET MVC (16)
    • JQuery&Javascript (12)
    • CSS (11)
    • 데이터베이스 (32)
    • Windows Server (6)
    • Active Directory (3)
    • Exchange (9)
    • JAVA (2)
    • JSP (39)
    • JSP 게시판 만들기 (21)
    • JSP 개발 참고 (15)
    • JSP 안드로이드 (4)
    • Servlet (17)
    • Spring (42)
    • HTML (14)
    • NodeJS (46)
    • MongoDB (11)
    • 리눅스 (18)
    • 자료구조 (16)
    • 아이폰 (24)
    • 안드로이드 (68)
    • API 활용하기 (10)
    • 소켓네트워크 (28)
    • 라즈베리파이 (11)
    • AWS클라우드 (10)
    • 빅데이터Hadoop (22)
    • 커널모듈프로그래밍 (8)
    • 기타 (10)
    • 자격증 (26)
최근 등록 현황
최근 글
최근 월별 글
최근 댓글
최근 글
최근 월별 글
최근 댓글
최근 글
최근 월별 글
최근 댓글
달력
지난달
2025.6
다음달
일월화수목금토
1234567
891011121314
15161718192021
22232425262728
2930
태그 구름
  • 안드로이드
  • 자료구조
  • 정보처리산업기사 16년 필기
  • 정보처리산업기사 15년
  • 정보처리산업기사 총정리
  • 정규화
  • 정보처리산업기사 요약
  • 커널 모듈 프로그래밍
  • nodejs MySQL 연동하기(Connection Pool)
  • 정규형
  • nodejs express
  • 데이터베이스
  • HTML
  • 소켓 프로그래밍
  • 안드로이드 intent
  • 카카오 로그인
  • 안드로이드 카카오 로그인 연동
  • 정보처리산업기사 필기 정리
  • 이클립스 디비 연동
  • 정보처리산업기사 정리
  • 카카오 로그인 연동
  • 정보처리기사 실기 정리
  • jsp
  • 정보처리산업기사 필기
  • 안드로이드 카카오 로그인
  • 정보처리산업기사 15년 필기
  • 리눅스
  • 소켓
  • 정보처리산업기사 16년
  • 이클립스 mysql 연동
카운터
전체 방문자
오늘
어제
Skin by M1REACT. Designed by M1STORY.TISTORY.COM. Valid XHTML 1.0 and CSS 3. Copyright ⓒ Riucc's Storage. All rights reserved.

티스토리툴바