본문 바로가기

판다스

파이썬을 엑셀처럼 사용하기 (2): 데이터 열기 pandas read_excel() 파이썬을 엑셀처럼 사용하기 시리즈 (1) 엑셀이 있는데 왜 파이썬을 배워야 하지? (2) 데이터 열기 pandas read_excel() (3) 데이터 정렬하기 pandas sort_values() (4) 데이터 필터링하기, 비교 연산자 pandas filtering (5) 사칙연산하기 pandas arithmetic (6) 데이터 합치기 pandas merge() (7) 피벗 테이블 만들기 pandas pivot_table() ✔ 실습하기 위해서는 파이썬 아나콘다와 주피터 노트북이 설치되어있어야 합니다. - [파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법 - [파이썬] 주피터 노트북(jupyter notebook) 사용법 ✔ 실습 데이터는 제 깃헙에서 받을 수 있습니다. 데이터1, 데이터2 앞.. 더보기
[파이썬] pandas 데이터프레임을 엑셀로 저장하기, 기존 파일에 새 시트 추가하기: to_excel(), pd.ExcelWriter() 특정 웹 사이트에서 매일 스크래핑하는 데이터를 엑셀 파일 하나에 일자별로 저장하고 싶다면 어떻게 할 수 있을까요? 판다스에서는 pd.ExcelWriter()를 사용해서 기존 파일에 새 시트만 추가하여 저장하는 방법이 있습니다. pd.ExcelWriter()를 사용해서 기존 파일에 새 시트 추가하여 저장하기 import pandas as pd # 특정 파일이 해당 경로에 존재하는지 알아보기 위하여 # os.path.exists() 메서드를 사용하겠습니다. import os 아래의 데이터프레임은 1일부터 3일까지의 인터넷 쇼핑몰의 과자 가격을 스크래핑한 가상의 데이터입니다. # 샘플 데이터 생성 day1 = {'날짜': ['2020-01-01', '2020-01-01'], '상품명': ['홈런볼', '초코파.. 더보기
[파이썬] pandas 데이터프레임을 엑셀로 저장하기, 둘 이상의 엑셀 시트로 저장하기: to_excel(), pd.ExcelWriter() 판다스 데이터프레임을 엑셀 형태로 저장하기 위해서는 to_excel() 메서드를 사용하면 됩니다. 이때 메서드의 매개 변수로 저장할 파일의 이름을 전달합니다. 경로를 별도 지정하지 않는다면 현재 스크립트가 위치한 폴더에 엑셀 파일이 생성됩니다. 샘플 데이터를 보겠습니다. import pandas as pd # 샘플 데이터프레임 생성 inventors = pd.DataFrame( { 'name': ['Nikola Tesla', 'Thomas Edison', 'Henry Ford'], 'born': ['1856/07/10', '1847/02/11', '1863/07/30'], 'died': ['1943/01/07', '1931/10/18', '1947/04/07'], 'age': [86, 84, 83] }).. 더보기
[파이썬] pandas 여러 개의 엑셀 시트를 하나의 데이터프레임으로 결합하기: pd.read_excel() 이번에는 여러 개의 엑셀 시트를 하나의 데이터프레임으로 합치는 방법을 알아보겠습니다. 샘플 데이터는 다음과 같이 생겼습니다. 온라인 소매 데이터로 세계 각국에서의 주문 기록이 담겨있습니다. 주문 국가에 따라 시트가 구분되어있으며 총 38개의 시트로 이루어졌습니다. - 샘플 데이터는 UCI Machine Learning Repository에서 제공하는 Online Retail Data Set를 수정하였습니다. 위의 데이터를 아래와 같은 하나의 데이터프레임으로 결합하여 데이터 분석이 가능한 형태로 만드는 것이 목표입니다. read_excel() 판다스에는 엑셀을 읽어오기 위한 메서드 read_excel()이 존재합니다. 사용하는 방법은 매우 간단합니다. 매개변수로 파일의 이름을 넣어주면 끝납니다. (단, 스.. 더보기
[파이썬] Pandas 컬럼 추가, 수정, 삭제하기: str.split(), str.replace() 데이터를 처리하다 보면 때때로 컬럼을 추가, 수정, 삭제해야 하는 경우가 있습니다. 예를 들어 기존의 데이터를 조합하여 새로운 컬럼을 만들고 싶을 수 있습니다. 또는 특정 값을 바꾸고 싶을 수도 있습니다. 이번 시간에는 컬럼을 추가, 수정하는 방법을 알아보겠습니다. 샘플 데이터 불러오기 In [1]: # 판다스 라이브러리 임포트 import pandas as pd # plotly express에 내장되어있는 gapminder 데이터프레임을 사용하겠습니다. import plotly.express as px # plotly가 설치되어있지 않다면 아래 명령으로 설치할 수 있습니다. # !pip install plotly In [2]: df = px.data.gapminder() 데이터 살펴보기 In [3]: .. 더보기
[파이썬] pandas 결과값을 csv 파일 형식으로 누적해서 저장하기: to_csv 크롤링 등을 작업을 마치고 나면 그 결과값을 누적해서 저장하고 싶을 경우가 있습니다. 이번 시간에는 .to_csv 메서드를 활용해서 누적 저장하는 방법을 알아보겠습니다. to_csv Append Mode 사용하기 import pandas as pd import os # 샘플 데이터 생성 soda = {'상품명': ['콜라', '사이다'], '가격': [2700, 2000]} df = pd.DataFrame(soda) # .to_csv # 최초 생성 이후 mode는 append if not os.path.exists('output.csv'): df.to_csv('output.csv', index=False, mode='w', encoding='utf-8-sig') else: df.to_csv('output.. 더보기
[파이썬] Pandas 특정 조건을 만족하는 데이터 필터링하기 이번에는 판다스를 이용해서 내가 원하는 조건으로 데이터를 필터링하는 방법을 알아보겠습니다. 샘플 데이터 불러오기 In [1]: # 판다스 라이브러리 임포트 import pandas as pd # plotly express에 내장되어있는 gapminder 데이터프레임을 사용하겠습니다. import plotly.express as px # plotly가 설치되어있지 않다면 아래 명령으로 설치할 수 있습니다. # !pip install plotly In [2]: df = px.data.gapminder() 데이터 살펴보기 In [3]: df.head() Out[3]: country continent year lifeExp pop gdpPercap iso_alpha iso_num 0 Afghanistan Asi.. 더보기
[파이썬] Pandas 행과 열로 데이터 추출하기: loc[ ], iloc[ ] 판다스에서 데이터를 행과 열로 데이터를 추출하는 방법을 살펴보겠습니다. 몇 가지 기본 문법만 숙지하면 다양한 방식으로 응용할 수 있습니다. 먼저 컬럼 데이터를 추출하는 방법을 알아보겠습니다. 데이터 불러오기 In [1]: # 판다스 라이브러리 임포트 import pandas as pd # plotly express에 내장되어있는 gapminder 데이터프레임을 사용하겠습니다. import plotly.express as px # plotly가 설치되어있지 않다면 아래 명령으로 설치할 수 있습니다. # !pip install plotly # 데이터 불러오기 df = px.data.gapminder() 컬럼 데이터 추출하기 데이터프레임에서 컬럼 데이터를 추출하려면 대괄호([ ])와 컬럼명을 사용해야 합니다... 더보기