파이썬을 엑셀처럼 사용하기 시리즈
(2) 데이터 열기 pandas read_excel()
(3) 데이터 정렬하기 pandas sort_values()
(4) 데이터 필터링하기, 비교 연산자 pandas filtering
(7) 피벗 테이블 만들기 pandas pivot_table()
✔ 실습하기 위해서는 파이썬 아나콘다와 주피터 노트북이 설치되어있어야 합니다.
- [파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법
- [파이썬] 주피터 노트북(jupyter notebook) 사용법
✔ 실습 데이터는 제 깃헙에서 받을 수 있습니다. 데이터1, 데이터2
엑셀에서 + - * / 문자를 이용하여 간단하게 사칙연산을 할 수 있습니다. 예를 들어 매출 중 매출원가가 차지하는 비중인 매출원가율을 구한다고 하면 아래 사진과 같이 할 수 있습니다.
판다스에서도 짧은 코드로 손쉽게 같은 결과를 구할 수 있습니다.
sales['매출원가율'] = sales['매출원가'] / sales['매출액']
sales
매출원가 컬럼을 매출액 컬럼으로 나눕니다. 그리고 그 결과를 매출원가율이라는 이름의 새 컬럼으로 저장하여 출력합니다. 엑셀과 달리 판다스에서는 작업을 수행하면 모든 행의 결과가 한 번에 계산되어 나타납니다.
사칙연산하기
판다스에서 컬럼끼리 사칙연산을 하기 위해서는 원하는 컬럼을 선택한뒤 + - * / 계산을 하면됩니다. 그리고 계산 결과를 새컬럼명으로 저장합니다. 가상의 컬럼을 이용하여 예를 들면 다음과 같습니다.
# 덧셈
sales['새컬럼명'] = sales['기존컬럼1'] + sales['기존컬럼2']
# 뺄셈
sales['새컬럼명'] = sales['기존컬럼1'] - sales['기존컬럼2']
# 나눗셈
sales['새컬럼명'] = sales['기존컬럼1'] / sales['기존컬럼2']
# 곱셉
sales['새컬럼명'] = sales['기존컬럼1'] * sales['기존컬럼2']
# 복잡한 연산도 가능합니다
sales['새컬럼명'] = (sales['기존컬럼1'] + sales['기존컬럼2']) / sales['기존컬럼3']
판다스에서도 코드 한 줄로 사칙연산을 하는 방법을 알아보았습니다.
-이 글은 아나콘다(Anaconda3)가 설치된 환경을 기준으로 작성되었습니다.