
데이터분석 프로젝트 : 전기차 데이터를 활용한 분석 데이터 제공 시행 목적 전기차를 구입하려는 사용자가 필요로 하는 정보를 제공하기 위해 전기차 데이터를 수집 하고 이를 데이터 베이스로 구축한다 . 수집된 데이터를 시각화 하여 제공할 수 있게 하고, 데이터를 분석하여 향후 전기차의 전망에 대해 예측한다. 나의 역할 1. [크롤링] 데이터 크롤링 두가지 하기 2. [정제] 전체차종의 보조금 데이터에서 인기차종의 데이터를 추출하여 연도별 인기차종의 보조금 합계구하기 3. [시각화] 지역별 인기차량의 판매량 데이터를 이용한 등치지도 그래프 작성 4. [시각화] 지역별 충전소 설치현황 데이터를 이용하여 등치 지도 그래프를 작성 필요한 데이터 1. 타고 홈페이지에서 인기차종 (판매대수 데이터프레임: pop_car..

데이터분석 프로젝트 : 전기차 데이터를 활용한 분석 데이터 제공 시행 목적 전기차를 구입하려는 사용자가 필요로 하는 정보를 제공하기 위해 전기차 데이터를 수집 하고 이를 데이터 베이스로 구축한다 . 수집된 데이터를 시각화 하여 제공할 수 있게 하고, 데이터를 분석하여 향후 전기차의 전망에 대해 예측한다. 나의 역할 1. [크롤링] 데이터 크롤링 두가지 하기 2. [정제] 전체차종의 보조금 데이터에서 인기차종의 데이터를 추출하여 연도별 인기차종의 보조금 합계구하기 3. [시각화] 지역별 인기차량의 판매량 데이터를 이용한 등치지도 그래프 작성 4. [시각화] 지역별 충전소 설치현황 데이터를 이용하여 등치 지도 그래프를 작성 필요한 데이터 1. 타고 홈페이지에서 인기차종 (판매대수 데이터프레임: pop_car..

시각화는 주어진 데이터를 활용하여 최대한 다양한 방법으로 데이터를 표현해 보기 월별 '전기' 키워드 빈도수 #월별 '전기' 키워드 빈도수 plt.figure(figsize=(9,6)) # 너비, 높이 x = key_df['전기'] y = key_df['발행월'] plt.scatter(x,y,alpha=0.1) plt.show() #가독성을 높이기 위해 일자를 월로 구분 해야겠음 월별 발행 뉴스 건수 (막대그래프) #월별 발행 뉴스 건수 (막대그래프) plt.figure(figsize=(9,6)) # 너비, 높이 count_m = key_df['발행월'].value_counts() count_m = count_m.sort_index() y = count_m.values x = count_m.index pl..

에너지 관련 단어에 대하여 적절한 통계량(평균, 표준편차, 최빈단어)을 구하기 각 결과들이 궁금하니 describe 결과와 각각 구한 결과들을 비교해 보면서 공부하기. key = ['에너지','전기','원자력','수력','화력'] # describe() 메서드 # 기본적인 몇가지 기술통계를 자동으로 추출 key_df.describe() #각 키워드의 평균 구하기 m_res_list=[] for i in key: m_res = key_df[i].mean() print(i + "평균 : "+ str(m_res)) m_res_list.append(m_res) 에너지평균 : 2.472945891783567 전기평균 : 1.1215764863059452 원자력평균 : 0.2939211756847027 수력평균 :..

[수집] 전자신문 섹션 중 산업에너지 환경에서 과학, 에너지 분야 크롤링하여 다음과 같이 csv 파일을 작성한다. ================== 분야 | 발행일|제목| 내용 ================== html = urlopen(target2) bs = soup(html.read(),'html.parser') branch_url = bs.find('a',attrs={'class':'on'}) #분야 page = bs.find('a',{'href':'javascript:;'}).text page_df=pd.DataFrame() try: for i in range(1,int(page)+1): target=subject+ branch_url['href']+"&page="+str(i) #target=s..