[파이썬 pandas 기초] 데이터프레임 결측 값 확인하는 방법: isna(), notna()
pandas dataframe으로 데이터를 다루다 보면 데이터 중 일부가 누락되어있는 경우가 종종 있습니다. 오늘은 누락된 데이터가 존재하는지 확인하는 방법을 알아보겠습니다. dataframe.isna() 이 메서드는 데이터프레임 내에 결측 값을 확인하여, 그 결과를 True 또는 False로 반환합니다. NA, None, numpy.nan은 True 값에 해당하고, 그 외 나머지는 False에 해당합니다. 샘플 데이터프레임을 만들어서 확인해 보겠습니다. df = pd.DataFrame({'name': ['Anne', 'Olaf', 'Ralph'], 'age': [4, 7, np.nan], 'hobby': [None, 'swimming', 'dance']}) df """ nameagehobby 0Anne..
더보기
[python pandas 기초] DataFrame의 속성: index, columns, shape, dtypes 등
파이썬을 이용해서 코딩을 하다 보면 많이 사용하는 라이브러리 중 하나가 바로 판다스입니다. 오늘은 pandas dataframe을 활용할 때 알아두면 도움이 되는 기초 속성 9가지를 알아보겠습니다. 코드 실습하기 # 라이브러리 불러오기 import pandas as pd # 샘플 데이터프레임 만들기 df = pd.DataFrame({'Animal': ['Falcon', 'Falcon','Parrot', 'Parrot'], 'Max Speed': [380., 370., 24., 26.], 'Weight': [1.5, 1.4, 2., 1.9]}) # 출력하기 df """ AnimalMax Speed Weight 0Falcon380.0 1.5 1Falcon370.0 1.4 2Parrot24.0 2.0 3Par..
더보기
[파이썬 pandas] 데이터프레임 컬럼 순서 변경, 추가, 이름 바꾸기
판다스를 사용하다 보면 생각보다 자주 필요한 기능이 칼럼의 순서를 바꾸고, 새 컬럼을 추가하고, 이름을 변경하는 것입니다. 사용법이 어려운 기능들은 아니지만 아직 pandas가 익숙하지 않은 분들은 종종 헷갈려하십니다. 이번 시간에는 칼럼을 다루는 세 가지 방법을 알아보겠습니다. 컬럼 순서 바꾸기 우선 오늘 예제로 사용할 데이터프레임을 만들겠습니다. # 라이브러리를 불러옵니다. import pandas as pd import numpy as np # 데이터프레임을 생성합니다. df = pd.DataFrame( {'name': ['KIM', 'LEE', 'SMITH','BROWN', 'MILLER'], 'age': [24, 32, 43, 24, np.nan], 'height': [178, 168, 171,..
더보기
[파이썬 pandas] 판다스 매개변수 axis의 의미를 알아보자
판다스를 사용하다 보면 평균 계산, 데이터프레임 열이나 행 삭제 작업등을 할 때 axis(축)을 지정해야 합니다. 축을 넣어야 할 때면 0을 넣어야 하는지 1을 넣어야 하는지 헷갈릴 수 있습니다. 이번 시간에는 바로 이 axis에 대해서 알아보겠습니다. ① aixs=0(index)은 행을 따라 동작합니다. 각 컬럼의 모든 행에 대해서 작용합니다. ② aixs=1(columns)은 열을 따라 동작합니다. 각 행의 모든 컬럼에 대해서 작동합니다. 그림으로 직관적으로 이해해 보겠습니다. 예제로 사용할 데이터프레임을 만들겠습니다. df = pd.DataFrame( {'name': ['KIM', 'LEE', 'SMITH','BROWN', 'MILLER'], 'age': [24, 32, 43, 24, np.nan]..
더보기