파이썬을 엑셀처럼 사용하기 시리즈
(2) 데이터 열기 pandas read_excel()
(3) 데이터 정렬하기 pandas sort_values()
(4) 데이터 필터링하기, 비교 연산자 pandas filtering
(7) 피벗 테이블 만들기 pandas pivot_table()
✔ 실습하기 위해서는 파이썬 아나콘다와 주피터 노트북이 설치되어있어야 합니다.
- [파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법
- [파이썬] 주피터 노트북(jupyter notebook) 사용법
✔ 실습 데이터는 제 깃헙에서 받을 수 있습니다. 데이터1, 데이터2
엑셀은 전 세계에서 가장 사랑받는 데이터 관리/분석 프로그램입니다. 스프레드 시트라는 눈에 보이는 화면이 있기 때문에 배우기에도 활용하기에도 매우 친절한 도구입니다. 여행 계획을 짤 때도 직장에서도 우리는 엑셀을 사용합니다.
반대로 파이썬에는 친절한 화면 같은 건 없습니다. 처음에 배우기는 조금 어렵지만 배우고 나면 거의 무한한 가능성을 제공합니다. 엑셀로 하는 업무를 빠르고 쉽게 할 수 있다는 점을 시작으로 여러 가지 장점이 있습니다.
파이썬의 장점
1. 다양한 데이터를 읽고 작업할 수 있습니다. xlsx, csv, sql 등
2. 복잡한 처리 작업들을 비교적 손쉽게 할 수 있습니다. 반복 작업을 효율적으로 자동화할 수 있습니다.
3. 대용량 데이터(GB 단위 이상)를 다룰 수 있습니다. 엑셀은 데이터 용량이 100MB을 넘어가거나, 데이터가 100만 행이 넘어가면 정상적으로 작동하지 않는 현상을 겪기도 합니다.
4. 다른 사람의 작업을 똑같이 재현하고 검증할 수 있습니다.
5. 손쉽게 데이터를 결합하고 분리할 수 있습니다. SQL처럼 데이터를 합치고 관계 연산을 수행할 수 있습니다.
분명 엑셀은 매우 훌륭한 도구입니다. 엑셀은 앞으로도 가장 많이 사용되는 데이터 관리/분석 프로그램일 것입니다. 그 사실을 부정할 수는 없습니다. 다만 엑셀 사용자가 파이썬까지 배운다면 두 가지 도구를 함께 잘 사용해서, 업무 시간을 더 효율적으로 사용하고 업무 성과도 향상할 수 있습니다. 모국어 외 언어도 할 줄 알면 세계에 대한 이해가 넓어지듯이, 엑셀 외 파이썬도 할 줄 알면 얻어지는 지식은 덤입니다.
이런 일들을 손쉽게 할 수 있습니다.
1. 여러 개의 파일/시트로 구분되어 있는 데이터를 하나의 시트로 합칠 수 있습니다.
2. 데이터를 특정 분류 기준에 따라 여러 개의 시트 또는 파일로 분리할 수 있습니다.
3. 양식이 정해진 엑셀 파일에 값을 업데이트하여 원하는 수만큼 순식간에 만들 수 있습니다.
예시: 업체별 발주서 파일을 만든다. (a, b, c, ... z 업체까지 26개의 발주서를 만들어야 한다면? 엑셀 막일은 이제 그만)
4. 매일 작성해야 하는 리포트를 자동으로 생성할 수 있습니다.
5. 경쟁 업체의 상품 가격 모니터링을 자동화할 수 있습니다. 가격이 변경되면 내게 알려줍니다.
이외에도 여러 가지 일들을 할 수 있습니다.
한 번에 다루기에는 너무 많은 내용이기 때문에, 우선은 첫 단계로 엑셀에서 할 수 있는 기본적인 작업들을 파이썬에서는 어떻게 할 수 있는지 비교하며 알아보겠습니다.
그럼 다음 글에서 만나요.