본문 바로가기

판다스

[파이썬] pandas 자료 구조: Series 기초 판다 스는 크게 두 가지 자료 구조로 이루어졌습니다. 첫 번째는 Series, 두 번째는 DataFrame 입니다. 오늘은 Series에 대해서 다루겠습니다. 판다스 불러오기 import pandas as pd Series 생성하기 s = pd.Series(data, index=index, name=name) 시리즈를 직관적으로 이해하는 가장 좋은 예시는 엑셀 시트의 열 하나를 떠올리는 겁니다. 엑셀과 달리 시리즈는 행의 이름(index)과 열의 이름(name)을 원하는 대로 입력할 수 있습니다. 별도로 입력하지 않는다면 index는 0부터 시작하는 정수 값이, name은 빈 값(None)이 입력됩니다. 또한 시리즈는 모든 데이터 유형(정수, 실수, 문자 등)을 담을 수 있습니다. 행 이름을 총칭하여 I.. 더보기
[파이썬] pandas melt(), value_counts(): 역대 로또 당첨번호 빈도 세기 예제 로또 사는 친구를 보니 문득 두 가지 사소한 궁금증이 생겼습니다. 1) 역대 로또 당첨번호 중 가장 많이 나온 숫자는 뭘까 2) 당첨 번호 구간별 출현 비중은 어떨까 매번 추첨 행위가 독립 시행이기 때문에 서로 아무 상관 관계도 없는 건 알지만, 재미 삼아해 해 봤습니다. 역대 로또 당첨결과 데이터 수집하기 로또 사업자인 동행복권 사이트에 들어가 보니 엑셀 다운로드 기능을 제공하고 있습니다. 따로 제공 안 하면 이거 스크래핑을 900번 정도 해야 하나 싶었는데 다행입니다. 엑셀 데이터 살펴보기 깔끔한 테이블 형태의 데이터를 기대했지만 템플릿(서식) 형태의 파일입니다. 이렇게 생긴 데이터를 가지고도 당첨 번호를 셀 수는 있겠지만 노가다를 해야 할 것 같습니다. 노가다는 제 취향이 아니기 때문에 pandas.. 더보기
[파이썬] pandas 데이터프레임을 HTML 테이블 태그로 변환하기 판다스에서 작업을 하다보면 결과물인 데이터프레임을 이메일, 웹사이트 등에 붙여넣고 싶을 때가 종종있습니다. 스크린 샷으로 붙여넣을 수도 있겠지만 HTML 테이블 태그를 삽입한다면 더 깔끔하고 보기 좋을겁니다. 이번 시간에는 DataFrame을 HTML 형식으로 변환시켜주는 메서드 to_html()에 대해 알아보겠습니다. 1. 데이터프레임을 HTML 테이블 태그로 변환하기 [In] import pandas as pd # 데이터프레임 샘플 df_sample = pd.DataFrame( {'name': ['Kim', 'LEE', 'Park', 'Choi'], 'math': [88, 74, 72, 85], 'english': [80, 90, 78, 80] }) # HTML로 변환하기 html = df_sampl.. 더보기
파이썬을 엑셀처럼 사용하기 (7): 피벗 테이블 만들기 pandas pivot_table() 파이썬을 엑셀처럼 사용하기 시리즈 (1) 엑셀이 있는데 왜 파이썬을 배워야 하지? (2) 데이터 열기 pandas read_excel() (3) 데이터 정렬하기 pandas sort_values() (4) 데이터 필터링하기, 비교 연산자 pandas filtering (5) 사칙연산하기 pandas arithmetic (6) 데이터 합치기 pandas merge() (7) 피벗 테이블 만들기 pandas pivot_table() ✔ 실습하기 위해서는 파이썬 아나콘다와 주피터 노트북이 설치되어있어야 합니다. - [파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법 - [파이썬] 주피터 노트북(jupyter notebook) 사용법 ✔ 실습 데이터는 제 깃헙에서 받을 수 있습니다. 데이터1, 데이터2 엑.. 더보기
파이썬을 엑셀처럼 사용하기 (6): 데이터 합치기 pandas merge() 파이썬을 엑셀처럼 사용하기 시리즈 (1) 엑셀이 있는데 왜 파이썬을 배워야 하지? (2) 데이터 열기 pandas read_excel() (3) 데이터 정렬하기 pandas sort_values() (4) 데이터 필터링하기, 비교 연산자 pandas filtering (5) 사칙연산하기 pandas arithmetic (6) 데이터 합치기 pandas merge() (7) 피벗 테이블 만들기 pandas pivot_table() ✔ 실습하기 위해서는 파이썬 아나콘다와 주피터 노트북이 설치되어있어야 합니다. - [파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법 - [파이썬] 주피터 노트북(jupyter notebook) 사용법 ✔ 실습 데이터는 제 깃헙에서 받을 수 있습니다. 데이터1, 데이터2 데.. 더보기
파이썬을 엑셀처럼 사용하기 (5): 사칙연산하기 pandas arithmetic 파이썬을 엑셀처럼 사용하기 시리즈 (1) 엑셀이 있는데 왜 파이썬을 배워야 하지? (2) 데이터 열기 pandas read_excel() (3) 데이터 정렬하기 pandas sort_values() (4) 데이터 필터링하기, 비교 연산자 pandas filtering (5) 사칙연산하기 pandas arithmetic (6) 데이터 합치기 pandas merge() (7) 피벗 테이블 만들기 pandas pivot_table() ✔ 실습하기 위해서는 파이썬 아나콘다와 주피터 노트북이 설치되어있어야 합니다. - [파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법 - [파이썬] 주피터 노트북(jupyter notebook) 사용법 ✔ 실습 데이터는 제 깃헙에서 받을 수 있습니다. 데이터1, 데이터2 엑.. 더보기
파이썬을 엑셀처럼 사용하기 (4): 데이터 필터링하기, 비교 연산자 pandas filtering 파이썬을 엑셀처럼 사용하기 시리즈 (1) 엑셀이 있는데 왜 파이썬을 배워야 하지? (2) 데이터 열기 pandas read_excel() (3) 데이터 정렬하기 pandas sort_values() (4) 데이터 필터링하기, 비교 연산자 pandas filtering (5) 사칙연산하기 pandas arithmetic (6) 데이터 합치기 pandas merge() (7) 피벗 테이블 만들기 pandas pivot_table() ✔ 실습하기 위해서는 파이썬 아나콘다와 주피터 노트북이 설치되어있어야 합니다. - [파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법 - [파이썬] 주피터 노트북(jupyter notebook) 사용법 ✔ 실습 데이터는 제 깃헙에서 받을 수 있습니다. 데이터1, 데이터2 이.. 더보기
파이썬을 엑셀처럼 사용하기 (3): 데이터 정렬하기 pandas sort_values() 파이썬을 엑셀처럼 사용하기 시리즈 (1) 엑셀이 있는데 왜 파이썬을 배워야 하지? (2) 데이터 열기 pandas read_excel() (3) 데이터 정렬하기 pandas sort_values() (4) 데이터 필터링하기, 비교 연산자 pandas filtering (5) 사칙연산하기 pandas arithmetic (6) 데이터 합치기 pandas merge() (7) 피벗 테이블 만들기 pandas pivot_table() ✔ 실습하기 위해서는 파이썬 아나콘다와 주피터 노트북이 설치되어있어야 합니다. - [파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법 - [파이썬] 주피터 노트북(jupyter notebook) 사용법 ✔ 실습 데이터는 제 깃헙에서 받을 수 있습니다. 데이터1, 데이터2 엑.. 더보기