공부 기록/Web Crawling

06. Data Analysis - tourist data_1

햇살아래 2022. 6. 10. 13:54

6. 한국 관광객 데이터 알아보기

 

6-1. 데이터 불러오기 및 전처리

6-1-1. 데이터 불러오기

  • 엑셀 데이터 불러오기

 

 

6-1-2. 데이터 탐색

  • 데이터 탐색

 

 

6-1-3. 칼럼 생성하기

  • 기준년월 추가

 

  • 국적 데이터만 남기기

 

  • 인덱스 재설정

 

  • 대륙 칼럼 만들기

 

 

6-2. 관광객 비율 칼럼 추가

 

  • 관광객비율 내림차순 정렬

 

  • 관광객비율 오름차순 정렬

 

  • pivot_table 함수

 

 

6-3. 중국 관광객 알아보기

6-3-1. 중국 국적 필터링

 

 

6-3-2. 기준년월별 전체 외국인 관광객 대비 국적별 관광객 비율

 

  • 전체비율 칼럼 생성

 

6-4. 데이터 전처리 과정 함수 생성

 

 

6-5. 반복문 통해 엑셀 데이터 불러와서 합치기

  • for문 (6자리로 정렬)

 

  • 빈 데이터프레임 만들기

 

  • 이중 반복문

* 위 반복문 실행 시 에러 발생 -> 2020년 6월 데이터가 존재하지 않기 때문이다. 그러나 에러가 발생하기 전까지의 작업은 정상적으로 이뤄졌기 때문에 2010년 1월 ~ 202년 5월까지의 데이터는 잘 담겨 있다.

 

 

  • 에러 없이 출력

 

  • 엑셀 파일로 저장

 

 

6-6. 국적별로 분류하여 저장

  • 국적 리스트 만들기

 

  • 국적별 관광객 데이터 저장