전체 글 67

[Data/Python] 데이터분석 정리 - 2

#개념 정리 #패스트캠퍼스 강의 정리 1. isin을 활용한 색인 내가 조건을 걸고자 하는 값이 내가 정의한 list에 있을 때만 색인하려는 경우에 사용한다. my_condition = ['플레디스', 'SM'] df['소속사'].isin(my_condition) df.loc[ df['소속사'].isin(my_condition) ] 2. 결측값(Null) 알아보기 -NaN 값에 대하여 null값은 비어있는 값을 말한다. info() 메소드를 통해 전체적으로 어떤 column에 빠진 데이터가 있는지 알 수 있다. df['그룹'].isnull() -NaN이 아닌 값에 대하여 Boolean 인덱싱 df['그룹'].notnull() 3. copy(복사) copy는 dataframe을 복사할 때 사용한다. df를..

[Data/Python] 데이터분석 정리 - 1

#개념 정리 #패스트캠퍼스 강의 정리 1. pandas 패키지 로드 별칭은 주로 pd 사용 import pandas as pd 2. pandas의 Series와 DataFrame -Series : 1차원, 1개의 column pd.Series([1,2,3,4]) -DataFrame 데이터 프레임은 여러 컬럼 즉, 여러 시리즈들의 결합체이다. 방법1. list로 만들기 방법2. dict로 만들기 company1 = [['삼성', 2000, '스마트폰'], company2 = {'기업명':['삼성', '현대', '네이버'], ['현대', 1000, '자동차'], '매출액': [2000, 1000, 500], ['네이버', 500, '포털']] '업종': ['스마트폰', '자동차', '포털'] } 3. CSV..

[Data/Python] '이것이 데이터 분석이다 with 파이썬' ch1-2 국가별 음주 데이터 분석하기

Chapter 01 데이터에서 인사이트 발견하기 1-2. 국가별 음주 데이터 분석하기 step1 탐색 : 데이터의 기초 정보 살펴보기 데이터 출처 : https://github.com/yoonkt200/python-data-analysis 이번 데이터셋을 이루고 있는 피처는 다음과 같다. country: 국가정보 beer_servings: beer 소비량 spirit_servings: spirit 소비량 wine_servings: wine 소비량 total_litres_of_alcohol: 총 알코올 소비량 continent: 국가의 대륙 정보 info() 함수로 데이터의 기초적인 정보를 살핀다. 총 193개의 데이터가 있으며, country와 continent를 제외한 피처들은 수치형 피처로 구성되어 ..

[Data / Python] '이것이 데이터 분석이다 with 파이썬' ch1-1 chipotle 주문 데이터 분석하기

Chapter 01 데이터에서 인사이트 발견하기 1-1. 멕시코풍 프랜차이즈 chipotle의 주문 데이터 분석하기 step1 탐색 : 데이터의 기초 정보 살펴보기 데이터 출처 : https://github.com/yoonkt200/python-data-analysis 데이터를 불러오기 위해서 read_csv() 함수를 사용하여 데이터 파일의 경로를 입력한다. 데이터 파일의 경로를 의미하는 변수는 file_path이며, 사용자가 데이터를 저장한 파일 경로를 입력한다. 그리고 shape()와 info() 함수를 호출하면 위와 같은 실행 결과를 볼 수 있다. shape()는 데이터의 행과 열의 크기를 반환하고, info()는 행의 구성 정보와 열의 구성 정보를 나타낸다. 실행 결과를 보면 데이터가 4,622..

[Data / Python] '이것이 데이터 분석이다 with 파이썬' ch.00

Chapter 00 들어가기 전에 02. 데이터 분석을 위한 라이브러리 라이브러리 설치하기 라이브러리를 설치하는 방법은 주피터 노트북을 설치하는 법과 동일하다. 'pip install' 옆에 설치하고 싶은 라이브러리 이름을 차례로 입력한다. 'pip install' 옆에 설치하고 싶은 라이브러리 이름을 차례로 입력한다. 판다스의 설치 및 활용 판다스는 파이썬에서 가장 널리 사용되는 데이터 분석 라이브러리로 데이터 프레임(Data Frame)이라는 자료구조를 사용한다. 데이터 프레임은 엑셀의 스프레드시트와 유사한 형태이며 파이썬으로 데이터를 쉽게 처리할 수 있다. 아래 코드는 데이터 분석 라이브러리를 import하는 코드이다. 판다스 라이브러리는 보통 pd라는 이름으로 축약하여 사용한다. 판다스의 데이터 ..

[Python] 백준 알고리즘 2562번 : 최댓값

https://www.acmicpc.net/problem/2562 2562번: 최댓값 9개의 서로 다른 자연수가 주어질 때, 이들 중 최댓값을 찾고 그 최댓값이 몇 번째 수인지를 구하는 프로그램을 작성하시오. 예를 들어, 서로 다른 9개의 자연수 3, 29, 38, 12, 57, 74, 40, 85, 61 이 주어 www.acmicpc.net 문제 9개의 서로 다른 자연수가 주어질 때, 이들 중 최댓값을 찾고 그 최댓값이 몇 번째 수인지를 구하는 프로그램을 작성하시오. 예를 들어, 서로 다른 9개의 자연수 3, 29, 38, 12, 57, 74, 40, 85, 61 이 주어지면, 이들 중 최댓값은 85이고, 이 값은 8번째 수이다. 입력 첫째 줄부터 아홉 번째 줄까지 한 줄에 하나의 자연수가 주어진다. ..

[Python] 백준 알고리즘 10818번 : 최소, 최대

https://www.acmicpc.net/problem/10818 10818번: 최소, 최대 첫째 줄에 정수의 개수 N (1 ≤ N ≤ 1,000,000)이 주어진다. 둘째 줄에는 N개의 정수를 공백으로 구분해서 주어진다. 모든 정수는 -1,000,000보다 크거나 같고, 1,000,000보다 작거나 같은 정수이다. www.acmicpc.net 문제 N개의 정수가 주어진다. 이때, 최솟값과 최댓값을 구하는 프로그램을 작성하시오. 입력 첫째 줄에 정수의 개수 N (1 ≤ N ≤ 1,000,000)이 주어진다. 둘째 줄에는 N개의 정수를 공백으로 구분해서 주어진다. 모든 정수는 -1,000,000보다 크거나 같고, 1,000,000보다 작거나 같은 정수이다. 출력 첫째 줄에 주어진 정수 N개의 최솟값과 최..

[SQLD] SQL 개발자 공부법 및 합격 기록

📌SQLD 공부법 및 합격 기록 1. 시험을 보게 된 이유 한 학기를 남기고 휴학을 결정하게 되면서 여러 가지 플랜을 짰다. 그중 자격증을 따야겠다 마음을 먹고 여러 자격증을 알아보던 중 SQLD를 알게 되었고 마침 내가 준비하던 진로에 맞는 자격증이라 준비하게 되었다. 또한 학교에서 '데이터베이스' 강의를 수강했기 때문에 대략적인 이론과 간단한 쿼리문은 작성할 수 있어 준비하는데 어렵지는 않았다. 2. 준비기간 및 공부시간 나는 작년 9월과 11월, 두 번에 걸쳐 시험을 봤으므로 준비기간은 두 달 반 정도 걸렸던 것 같다. 9월 시험을 봤을 때는 나름 열심히 준비한다고 했지만 중간중간 공부하기 싫어 놀기도 했고 제대로 된 공부를 하지 않았었다. 그러다 첫 번째 시험을 치르고 아, 이 정도로 공부해서는 ..

[Python] 백준 알고리즘 10951번 : A + B - 4

https://www.acmicpc.net/problem/10951 10951번: A+B - 4 두 정수 A와 B를 입력받은 다음, A+B를 출력하는 프로그램을 작성하시오. www.acmicpc.net 문제 두 정수 A와 B를 입력받은 다음, A+B를 출력하는 프로그램을 작성하시오. 입력 입력은 여러 개의 테스트 케이스로 이루어져 있다. 각 테스트 케이스는 한 줄로 이루어져 있으며, 각 줄에 A와 B가 주어진다. (0 < A, B < 10) 출력 각 테스트 케이스마다 A+B를 출력한다. 풀이 전 단계 문제인 10952번은 테스트 케이스의 수가 정해져 있지만 이번 문제는 수가 주어지지 않았기 때문에 어떻게 출력을 해야할지 고민을 했다. 수가 입력되지 않아 에러가 발생하면 반복문을 끝낼 수 있도록 try-e..

[Python] 백준 알고리즘 10952번 : A + B - 5

https://www.acmicpc.net/problem/10952 10952번: A+B - 5 두 정수 A와 B를 입력받은 다음, A+B를 출력하는 프로그램을 작성하시오. www.acmicpc.net 문제 두 정수 A와 B를 입력받은 다음, A+B를 출력하는 프로그램을 작성하시오. 입력 입력은 여러 개의 테스트 케이스로 이루어져 있다. 각 테스트 케이스는 한 줄로 이루어져 있으며, 각 줄에 A와 B가 주어진다. (0 < A, B < 10) 입력의 마지막에는 0 두 개가 들어온다. 출력 각 테스트 케이스마다 A+B를 출력한다. 풀이 1라인 : 0 0 을 만날 때까지 무한 반복해야 하므로 조건문을 True로 설정한다. 2라인 : 여러 개의 테스트 케이스를 출력해야 하므로 while문 안에 작성한다. 3라인..