새소식

SCIENCE OF DATA ANALYSIS/데이터 분석을 위한 CS

[파이썬 훈련] #001. Pandas DataFrame Query 문법 예제

  • -

안녕하세요 통계학도 데잇입니다.

데이터 분석을 위한 코딩, Python Pandas Query를 알아봅니다.


파이썬 Pandas DataFrame은 SQL 못지 않게 편리한 데이터 분석 도구입니다.

SQL이 익숙한 당신을 위한 Query 문법을 사례를 통해 간단히 알아봅시다.

Figure1.  TRAINING PYTHON!


 

도움이 되셨다면 공감 꾸욱! 질문은 댓글로 언제든지!

 

단일 조건으로 필터링

df.query('Age > 30') # 'Age' 컬럼이 30보다 큰 모든 행을 선택합니다.

여러 조건으로 필터링 (AND, OR)

df.query('Age > 30 & Gender == "male"') # 'Age'가 30보다 크고, 'Gender'가 'male'인 행을 선택합니다.
df.query('Age < 18 | Age > 65') # 'Age'가 18 미만이거나 65 초과인 행을 선택합니다.

인덱스를 사용한 필터링

df.query('index > 10') # 인덱스가 10보다 큰 행을 선택합니다.

변수 사용

threshold = 30 df.query('Age > @threshold') # 외부 변수 'threshold'를 참조합니다.

문자열 부분 일치

df.query('Name.str.contains("John")', engine='python') # 'Name'에 'John'을 포함하는 행을 선택합니다.

리스트에 있는(없는) 값 필터링

df.query('Country in ["Korea", "Japan"]') # 'Country'가 'Korea' 또는 'Japan'인 행을 선택합니다.
df.query('Country not in ["Korea", "Japan"]') # 'Country'가 'Korea'와 'Japan'이 아닌 행을 선택합니다.

null 값 필터링

df.query('Country == Country') # 'Country'가 null이 아닌 행을 선택합니다
df[df['Country'].isna()] # 이 사용법을 추천합니다

 

Contents

소중한 공감 감사합니다

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 댓글/공감 꾸욱!