6. 한국 관광객 데이터 알아보기
6-1. 데이터 불러오기 및 전처리
6-1-1. 데이터 불러오기
- 엑셀 데이터 불러오기
6-1-2. 데이터 탐색
- 데이터 탐색
6-1-3. 칼럼 생성하기
- 기준년월 추가
- 국적 데이터만 남기기
- 인덱스 재설정
- 대륙 칼럼 만들기
6-2. 관광객 비율 칼럼 추가
- 관광객비율 내림차순 정렬
- 관광객비율 오름차순 정렬
- pivot_table 함수
6-3. 중국 관광객 알아보기
6-3-1. 중국 국적 필터링
6-3-2. 기준년월별 전체 외국인 관광객 대비 국적별 관광객 비율
- 전체비율 칼럼 생성
6-4. 데이터 전처리 과정 함수 생성
6-5. 반복문 통해 엑셀 데이터 불러와서 합치기
- for문 (6자리로 정렬)
- 빈 데이터프레임 만들기
- 이중 반복문
* 위 반복문 실행 시 에러 발생 -> 2020년 6월 데이터가 존재하지 않기 때문이다. 그러나 에러가 발생하기 전까지의 작업은 정상적으로 이뤄졌기 때문에 2010년 1월 ~ 202년 5월까지의 데이터는 잘 담겨 있다.
- 에러 없이 출력
- 엑셀 파일로 저장
6-6. 국적별로 분류하여 저장
- 국적 리스트 만들기
- 국적별 관광객 데이터 저장
'공부 기록 > Web Crawling' 카테고리의 다른 글
08. Data Analysis - instagram researching_1 (0) | 2022.06.26 |
---|---|
07. Data Analysis - tourist data_2 (0) | 2022.06.10 |
05. Data Analysis Crawling - youtube ranking_2 (0) | 2022.06.03 |
04. Data Analysis Crawling - youtube ranking_1 (0) | 2022.06.03 |
03. Data Analysis Crawling - melon, bugs, gennie (0) | 2022.06.03 |