본문 바로가기

파이썬

[파이썬] pandas 데이터프레임을 엑셀로 저장하기, 둘 이상의 엑셀 시트로 저장하기: to_excel(), pd.ExcelWriter() 판다스 데이터프레임을 엑셀 형태로 저장하기 위해서는 to_excel() 메서드를 사용하면 됩니다. 이때 메서드의 매개 변수로 저장할 파일의 이름을 전달합니다. 경로를 별도 지정하지 않는다면 현재 스크립트가 위치한 폴더에 엑셀 파일이 생성됩니다. 샘플 데이터를 보겠습니다. import pandas as pd # 샘플 데이터프레임 생성 inventors = pd.DataFrame( { 'name': ['Nikola Tesla', 'Thomas Edison', 'Henry Ford'], 'born': ['1856/07/10', '1847/02/11', '1863/07/30'], 'died': ['1943/01/07', '1931/10/18', '1947/04/07'], 'age': [86, 84, 83] }).. 더보기
[파이썬] pandas 여러 개의 엑셀 시트를 하나의 데이터프레임으로 결합하기: pd.read_excel() 이번에는 여러 개의 엑셀 시트를 하나의 데이터프레임으로 합치는 방법을 알아보겠습니다. 샘플 데이터는 다음과 같이 생겼습니다. 온라인 소매 데이터로 세계 각국에서의 주문 기록이 담겨있습니다. 주문 국가에 따라 시트가 구분되어있으며 총 38개의 시트로 이루어졌습니다. - 샘플 데이터는 UCI Machine Learning Repository에서 제공하는 Online Retail Data Set를 수정하였습니다. 위의 데이터를 아래와 같은 하나의 데이터프레임으로 결합하여 데이터 분석이 가능한 형태로 만드는 것이 목표입니다. read_excel() 판다스에는 엑셀을 읽어오기 위한 메서드 read_excel()이 존재합니다. 사용하는 방법은 매우 간단합니다. 매개변수로 파일의 이름을 넣어주면 끝납니다. (단, 스.. 더보기
[파이썬] Pandas 컬럼 추가, 수정, 삭제하기: str.split(), str.replace() 데이터를 처리하다 보면 때때로 컬럼을 추가, 수정, 삭제해야 하는 경우가 있습니다. 예를 들어 기존의 데이터를 조합하여 새로운 컬럼을 만들고 싶을 수 있습니다. 또는 특정 값을 바꾸고 싶을 수도 있습니다. 이번 시간에는 컬럼을 추가, 수정하는 방법을 알아보겠습니다. 샘플 데이터 불러오기 In [1]: # 판다스 라이브러리 임포트 import pandas as pd # plotly express에 내장되어있는 gapminder 데이터프레임을 사용하겠습니다. import plotly.express as px # plotly가 설치되어있지 않다면 아래 명령으로 설치할 수 있습니다. # !pip install plotly In [2]: df = px.data.gapminder() 데이터 살펴보기 In [3]: .. 더보기
[파이썬 엑셀 자동화] 파이썬 xlwings로 엑셀 다루기: 엑셀 통합문서, 시트, 셀 연결하기 파이썬을 배우고 단순 반복 업무는 컴퓨터에게 맡기세요. 오늘은 엑셀 업무를 자동화하기 위해서 파이썬에서 엑셀을 다루는 방법을 알아보는 첫 시간입니다. 아나콘다(Anaconda3)가 설치되어있어야 아래 코드를 따라 하실 수 있습니다. (설치방법) - 또는 xlwings 라이브러리를 별도로 설치하시면 됩니다. xlwings 파이썬에는 xlwings, openpyxl, xlsxwriter 등 여러가지 파이썬 엑셀 라이브러리가 있습니다. 그중에 xlwings를 사용하여 파이썬으로 엑셀을 다루어 보겠습니다. xlwings를 사용하기 위해서는 엑셀이 설치되어있어야 합니다. 라이브러리 불러오기 xlwings 라이브러리를 불러옵니다. 앞으로 xw라는 축약어로 사용하겠습니다. import xlwings as xw 통합 .. 더보기
[파이썬] 파이썬 독학으로 코딩 배울 수 있는 사이트 추천 4선 코딩이 어느새 모든 직무에서 점점 더 필요한 역량이 되어가고 있습니다. 일반 직장인들 중에도 단순 반복 업무를 파이썬 스크립트로 자동화하고 그 시간에 꿀을 빠는 바람직한 사례가 늘어나고 있습니다. (저도 그중 한 명입니다) 다들 좋다고 하니 한번 배워보고 싶은데, 책을 사거나 강의 결제를 하기에는 처음 시작하는 입장에서 부담스러운 게 사실입니다. 그래서 오늘은 파이썬을 독할 할 수 있는 무료 사이트 4곳을 추천드립니다. 여기서 코딩을 시작해보면 어떨까요? 1. [온라인 책] 점프 투 파이썬 점프 투 파이썬은 파이썬을 처음 접하는 초보자들에게 가장 인기 있는 책입니다. 전문적인 용어들은 가급적 배제하고 알기 쉬운 말들로 쓰여있는 것이 장점입니다. 입문자에게 가장 추천드립니다. 2. [동영상 강의] 김왼손의.. 더보기
[파이썬] 파이썬 아나콘다 설치 방법, 파이썬 설치 방법 오늘은 파이썬 아나콘다를 설치하는 방법을 알아보겠습니다. 파이썬은 공식 홈페이지인 python.org에서 무료로 다운로드할 수 있지만 업무 자동화, 데이터 분석 등과 같은 일을 하기 위해서는 많은 추가 라이브러리들이 필요합니다. 하지만 아직 파이썬에 익숙하지 않은 초보자에게는 라이브러리 설치부터가 약간 까다로운 일일 수 있습니다. 이런 문제를 피하기 위해서 개인적으로 아나콘다를 설치하는 것을 추천합니다. 아나콘다는 파이썬과 여러 가지 라이브러리를 쉽게 설치하고 관리할 수 있는 배포판입니다. 아나콘다 설치 파일 다운로드 아나콘다 배포판을 설치하기 위해서 다음 웹 사이트로 이동합니다. https://www.anaconda.com/distribution/ 운영체제를 선택한 후 파이썬 버전을 선택합니다. 파이썬.. 더보기
[파이썬] CSS selector를 이용해서 데이터를 스크래핑하기: select(), select_one() 이번에는 CSS selector를 이용해서 데이터를 추출하는 방법을 알아보겠습니다. CSS는 HTML 요소의 스타일을 정의한 문서입니다. 그렇다면 어떤 요소에 어떤 스타일을 주어야하는지 명확하게 지정할 필요가 있겠죠. 이러한 목적으로 사용되는 것이 selector(선택자)입니다. selector { property1: value1; property2: value2; } CSS는 위와 같이 선택자를 쓰고 { } 괄호 안에 프로퍼티와 값을 지정하는 방식으로 사용합니다. 1. 태그 선택자 사용법 # 태그 이름이 tag1인 html요소를 리스트 형태로 모두 반환합니다. soup.select('tag1') # 태그 이름이 tag1인 html요소중 첫번째 요소만 반환합니다. soup.select_one('tag1'.. 더보기
[파이썬] 파이썬 업무 자동화: 윈도우 작업 스케줄러를 사용해서 스크립트 실행하기 이번에는 윈도우 환경에서 정해진 시간마다 자동으로 파이썬 스크립트를 실행시키는 방법을 알아보겠습니다. 윈도우 검색창에서 "작업"이라는 단어를 검색하면 아래와 같이 작업 스케줄러를 찾을 수 있습니다. 실행해주세요. 작업 스케줄러 실행 작업 스케줄러가 실행되면 아래와 같은 화면을 볼 수 있습니다. 작업 만들기를 클릭합니다. 새 작업 만들기 1) 작업 이름을 입력합니다. 보안 옵션에서 가장 높은 수준의 권한으로 실행을 클릭합니다. 2) 트리거 탭에서 작업 시간과 관련된 세부 내용은 설정합니다. 3) 동작 탭에서 실행시킬 프로그램과 스크립트를 설정합니다. 프로그램/스크립트는 다음과 같이 입력하면 됩니다. C:\Users\name\Anaconda3\pythonw.exe 혹시 파이썬이 설치된 위치를 모른다면 명령 .. 더보기