공부 기록/Web Crawling
06. Data Analysis - tourist data_1
햇살아래
2022. 6. 10. 13:54
6. 한국 관광객 데이터 알아보기
6-1. 데이터 불러오기 및 전처리
6-1-1. 데이터 불러오기
- 엑셀 데이터 불러오기

6-1-2. 데이터 탐색
- 데이터 탐색



6-1-3. 칼럼 생성하기
- 기준년월 추가

- 국적 데이터만 남기기



- 인덱스 재설정

- 대륙 칼럼 만들기


6-2. 관광객 비율 칼럼 추가

- 관광객비율 내림차순 정렬

- 관광객비율 오름차순 정렬

- pivot_table 함수

6-3. 중국 관광객 알아보기
6-3-1. 중국 국적 필터링

6-3-2. 기준년월별 전체 외국인 관광객 대비 국적별 관광객 비율

- 전체비율 칼럼 생성

6-4. 데이터 전처리 과정 함수 생성

6-5. 반복문 통해 엑셀 데이터 불러와서 합치기
- for문 (6자리로 정렬)

- 빈 데이터프레임 만들기

- 이중 반복문

* 위 반복문 실행 시 에러 발생 -> 2020년 6월 데이터가 존재하지 않기 때문이다. 그러나 에러가 발생하기 전까지의 작업은 정상적으로 이뤄졌기 때문에 2010년 1월 ~ 202년 5월까지의 데이터는 잘 담겨 있다.
- 에러 없이 출력

- 엑셀 파일로 저장

6-6. 국적별로 분류하여 저장
- 국적 리스트 만들기

- 국적별 관광객 데이터 저장
