목록빅데이터 (2)
헬창 개발자
4학년 2학기는 대회 준비때문에 많이 바쁘게 흘러 갔다. 원래 취준을 하려고 했는데 아직 부족한게 많고 대외활동도 하고 싶어서 미뤘다가 마침 빅데이터 경진대회가 있다고해서 참여를 했다. 연구는 항상 가설을 세우는게 중요한거 같다. 우리 팀의 가설은 전라북도의 에너지 자립도가 최하이이며 그중 전주시가 제일 낮다라는 기사를 발견하고 데이터를 수집했다. 에너지 자립을 높일 수 있는 방법을 찾기위해 태양광 발전기를 생각했고 에너지 자립도가 낮은 행정동에 풍부한 일조량등등 태양광 발전기가 도입 될 수 있는 최적의 위치를 분석했다. 데이터 분석 모델링은 다음 처럼 설계했다. 데이터를 수집하면서 느낀점은 전라북도에서 제공하는 데이터가 너무 적다는것이다. 서울시 데이터포털만해도 방대한 데이터인데 전라북도는... 수집한..
미세먼지는 대기 중 장기간 떠다니는 인위적으로 발생하는 지름 10㎛ 이하의 먼지를 지칭한다. 미세먼지 줄이기 위해서는 도시 숲을 만들어 미세먼지를 정화하는 작업이 필요하다. 도시 숲이란 도시에서 국민의 보건 및 휴양 증진을 위한 산림 및 수목을 말한다. 이런 도시 숲은 열섬현상과 완화와 미세먼지 감소 효과가 있다는 연구가 있다. 하지만 이런 도시 숲을 최적의 위치에 조성하기 위해서는 미세먼지의 영향을 주는 요인에 대해 상관관계를 분석해야 하며 도시 숲이 조성되었을 때 미세먼지 증감률을 비교할 수 있어야 한다. 특정 지역의 미세먼지 상관관계를 분석하기 위해 서울시를 대상으로 정했다. 데이터 수집은 서울시 열린 데이터광장에서 제공하는 데이터를 활용하였다. 데이터의 전처리를 위해 필요한 컬럼을 서울시 행정구에..