[Hadoop] - 공공데이터 활용하여 분석해보기
빅데이터Hadoop2017. 6. 28. 13:15
336x280(권장), 300x250(권장), 250x250, 200x200 크기의 광고 코드만 넣을 수 있습니다.
○ 공공데이터 활용하여 분석해보기 |
공공데이터 다운로드 주소 : http://opendata.hira.or.kr/op/opc/selectOpenDataList.do 여기서 대장암 환자의 신장, 체중자료(2012~2013) 2만건 정도의 데이터를 분석해보았다 1. 필요한 데이터인 나이, 성별, 키, 체중만을 pig를 이용하여 뽑는다 2. 얻은 데이터를 MapReduce 하여 통계를 낸다 3. 해당 결과를 확인해서 분석해보면 12~13 2년동안 남자가 여자보다 대장암에 많이 걸린 사실을 알 수 있고 특정 키와 특정 몸무게 값의 수치들을 보면 뚱뚱한 사람이 꼭 대장암이 많이 걸린다고는 할 수 없다는 사실을 알 수 있다. |
'빅데이터Hadoop' 카테고리의 다른 글
[Hadoop] - HBase Shell 사용하기 (0) | 2017.07.03 |
---|---|
[Hadoop] - 하이브(hive) 예제 : 강남구 미세먼지 다루기 (0) | 2017.06.28 |
[Hadoop] - 피그(pig) 예제 : passwd 파일 데이터 추출하기 (0) | 2017.06.27 |
[Hadoop] - 맵리듀스(MapReduce) 예제 : Word Count (0) | 2017.06.27 |
[Hadoop] - HDFS + Hue UI 사용하기 (0) | 2017.06.27 |
댓글()