공부 기록 58

03. Data Analysis Crawling - melon, bugs, gennie

3. 멜론, 벅스, 지니 음원차트 크롤링 3-1. 멜론 차트 크롤링 3-1-1. 크롬드라이버 실행 멜론 인기차트 웹 페이지 접속 BeautifulSoup 이용해 정보 추출 3-1-2. 멜론 곡 정보 태그 읽기 100개의 노래 태그 찾기 곡 제목 찾기 곡 제목 가져오기 가수 정보 가져오기 멜론 100위 노래순위 정보 가져오기 3-1-3. 멜론 인기차트 중 상위 100곡 크롤링(정리) 3-1-4. 멜론 인기차트 엑셀에 저장 곡과 가수명 song_data에 저장 song_data 리스트를 이용해 데이터프레임 만들기 엑셀로 저장 3-2. 벅스 차트 크롤링 3-2-1. 벅스 사이트 접속 3-2-2. 곡과 가수명 찾기 곡 정보 찾기 한 개의 곡 정보 지정하기 곡 제목 찾기 가수 이름 찾기 벅스 100위 노래 순위 ..

02. Web Crawling

웹 크롤링: 웹 페이지에 있는 정보를 가지고 오는 것 selenium의 webdriver는 크롬이나 인터넷 익스플로러 등에서 사이트 접속, 버튼 클릭, 글자 입력과 같이 웹 브라우저에서 사람이 할 수 있는 일들을 코드를 통해 제어 가능한 라이브러리 예제 코드 : https://github.com/Play-with-data/datasalon/blob/master/02_%EA%B0%9C%EC%A0%95%ED%8C%90/2_Data_Analysis_Basic/2_2_Crawling.ipynb 2-1. 라이브러리 설치 크롬드라이버는 selenium의 webdriver를 통해 파이썬에서 크롬 브라우저를 제어할 수 있도록 도와준다. 웹 페이지 접속 & 다운로드 2-2. html 구조 살펴보기 예제 코드 Beauti..

01. Data Analysis Basics

file download : https://github.com/Play-with-data/datasalon 02_개정판 이용 1-1. 데이터 불러오기 pandas: 테이블 형태의 데이터를 쉽게 다룰 수 있는 파이썬 라이브러리 라이브러리 불러오기 엑셀 데이터 불러오기 데이터 정보 살펴보기 1-2. 데이터 선택 데이터 확인 칼럼 선택 칼럼 생성 필터링 1-3. 데이터 통합 - merge column을 옆으로 동합한다 1-4. 데이터 통합 - append column을 아래로 통합한다. 1-5. 데이터 저장 - to_excel 엑셀 파일 저장 시 index 번호를 제외하고 저장하고 싶다면 index=False를 인자로 설정 1-6. 데이터 집계 - pivot_table 피벗 테이블 : 기존 데이터의 칼럼을 재..

[Data/Python] 데이터분석 정리 - 7

#개념 정리 #패스트캠퍼스 강의 정리 seaborn : matplotlib을 더 사용하기 쉽게 해주는 라이브러리 seaborn 공시 도큐먼트 살펴보기 import seaborn as sns plt.rc('font', family='NanumBarunGothic') plt.rcParams["figure.figsize"] = (12, 9) 0. seaborn이란? - seaborn에서만 제공되는 통계 기반 plot - 아름다운 스타일링 : matplotlib의 기본 컬러 색상보다 default 컬러가 예쁘게 조합된다. - 컬러 팔레트 #seaborn의 컬러팔레트 - pandas 데이터프레임과 높은 호환성 1. Scatterplot 0~1 사이의 임의의 랜덤한 값을 생성한다. 1-1. x, y, colors,..

[SQL] 프로그래머스 - 중복 제거하기

문제 설명 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다. NAME TYPE NULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE INTAKE_CONDITION VARCHAR(N) FALSE NAME VARCHAR(N) TRUE SEX_UPON_INTAKE VARCHAR(N)..

[SQL] 프로그래머스 - 동물 수 구하기

문제 설명 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다. NAME TYPE NULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE INTAKE_CONDITION VARCHAR(N) FALSE NAME VARCHAR(N) TRUE SEX_UPON_INTAKE VARCHAR(N)..

[SQL] 프로그래머스 - 최솟값 구하기

문제 설명 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다. NAME TYPE NULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE INTAKE_CONDITION VARCHAR(N) FALSE NAME VARCHAR(N) TRUE SEX_UPON_INTAKE VARCHAR(N)..

[SQL] 프로그래머스 - 최댓값 구하기

문제 설명 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다. NAME TYPE NULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE INTAKE_CONDITION VARCHAR(N) FALSE NAME VARCHAR(N) TRUE SEX_UPON_INTAKE VARCHAR(N)..

[SQL] 프로그래머스 - 상위 n개 레코드

문제 설명 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다. NAME TYPE NULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE INTAKE_CONDITION VARCHAR(N) FALSE NAME VARCHAR(N) TRUE SEX_UPON_INTAKE VARCHAR(N)..

[SQL] 프로그래머스 - 여러 기준으로 정렬하기

문제 설명 ANIMAL_INS 테이블은 동물 보호소에 들어온 동물의 정보를 담은 테이블입니다. ANIMAL_INS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, INTAKE_CONDITION, NAME, SEX_UPON_INTAKE는 각각 동물의 아이디, 생물 종, 보호 시작일, 보호 시작 시 상태, 이름, 성별 및 중성화 여부를 나타냅니다. NAME TYPE NULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE INTAKE_CONDITION VARCHAR(N) FALSE NAME VARCHAR(N) TRUE SEX_UPON_INTAKE VARCHAR(N)..