데이터분석
-
통추리, 첫 번째 시리즈는 흩어진 확률분포를 한 곳에 모으는 것입니다. 이것을 확률분포 마을이라고 부르겠습니다. 확률분포 마을에는 누가 어디에 어떤 모습으로 살고 있을까요? 마을 주민을 모두 만나고 나면, 더 이상 확률분포가 낯설게 느껴지지 않을 거예요. $X$ 1. 확률분포 마을의 주민 이산형 주민들: 이들은 단속적으로 끊어지는 특성이 있습니다. 딱딱 맞아떨어지는 그들의 모습은 마치 T형 성격 같아요. 특히, 논리력이 뛰어난 개발자의 형상을 지니고 있습니다. 이산형 주민들의 목록은 다음과 같습니다. Bernoulli, Binomial, Geometric, Negative Binomial, Hyper Geometric, Categorical, Multinomial, Poisson 연속형 주민들: 이들은 ..
[확률분포 마을] #001 확률분포의 직관적 의미와 관계 총정리통추리, 첫 번째 시리즈는 흩어진 확률분포를 한 곳에 모으는 것입니다. 이것을 확률분포 마을이라고 부르겠습니다. 확률분포 마을에는 누가 어디에 어떤 모습으로 살고 있을까요? 마을 주민을 모두 만나고 나면, 더 이상 확률분포가 낯설게 느껴지지 않을 거예요. $X$ 1. 확률분포 마을의 주민 이산형 주민들: 이들은 단속적으로 끊어지는 특성이 있습니다. 딱딱 맞아떨어지는 그들의 모습은 마치 T형 성격 같아요. 특히, 논리력이 뛰어난 개발자의 형상을 지니고 있습니다. 이산형 주민들의 목록은 다음과 같습니다. Bernoulli, Binomial, Geometric, Negative Binomial, Hyper Geometric, Categorical, Multinomial, Poisson 연속형 주민들: 이들은 ..
2023.12.02 -
안녕하세요 통계학도 데잇입니다. 빅쿼리에서 JSON으로 저장된 데이터를 마주할 때는 일반적이지 않은 문법에 당황하곤 합니다. 다음 JSONPath 전용 기호를 배워둡시다! 아래와 같은 기호들은 JSONPath 표현식에서 복잡한 데이터 구조 내에서 특정 데이터에 효과적으로 접근하게 해줍니다. 1. $ - 루트 객체 정의 : JSONPath 쿼리의 시작점을 나타내며, JSON 문서의 최상위 레벨을 가리킵니다. 2. . 또는 [] - 자식 연산자 . : 자식 요소에 접근하는 데 사용됩니다. 예를 들어, $.name은 루트 객체의 name 필드를 가리킵니다. [ ] : 배열 인덱스나 필터 표현식에 사용됩니다. 예를 들어, $.phones[0]은 phones 배열의 첫 번째 요소를 의미합니다. 3. .. - 재귀..
[빅쿼리 훈련] #001 빅쿼리 JSONPath 표현식안녕하세요 통계학도 데잇입니다. 빅쿼리에서 JSON으로 저장된 데이터를 마주할 때는 일반적이지 않은 문법에 당황하곤 합니다. 다음 JSONPath 전용 기호를 배워둡시다! 아래와 같은 기호들은 JSONPath 표현식에서 복잡한 데이터 구조 내에서 특정 데이터에 효과적으로 접근하게 해줍니다. 1. $ - 루트 객체 정의 : JSONPath 쿼리의 시작점을 나타내며, JSON 문서의 최상위 레벨을 가리킵니다. 2. . 또는 [] - 자식 연산자 . : 자식 요소에 접근하는 데 사용됩니다. 예를 들어, $.name은 루트 객체의 name 필드를 가리킵니다. [ ] : 배열 인덱스나 필터 표현식에 사용됩니다. 예를 들어, $.phones[0]은 phones 배열의 첫 번째 요소를 의미합니다. 3. .. - 재귀..
2023.11.30 -
안녕하세요 통계학도 데잇입니다. 데이터 분석을 위한 코딩, Python Pandas Query를 알아봅니다. 파이썬 Pandas DataFrame은 SQL 못지 않게 편리한 데이터 분석 도구입니다. SQL이 익숙한 당신을 위한 Query 문법을 사례를 통해 간단히 알아봅시다. 도움이 되셨다면 공감 꾸욱! 질문은 댓글로 언제든지! 단일 조건으로 필터링 df.query('Age > 30') # 'Age' 컬럼이 30보다 큰 모든 행을 선택합니다. 여러 조건으로 필터링 (AND, OR) df.query('Age > 30 & Gender == "male"') # 'Age'가 30보다 크고, 'Gender'가 'male'인 행을 선택합니다. df.query('Age 65') # 'Age'가..
[파이썬 훈련] #001. Pandas DataFrame Query 문법 예제안녕하세요 통계학도 데잇입니다. 데이터 분석을 위한 코딩, Python Pandas Query를 알아봅니다. 파이썬 Pandas DataFrame은 SQL 못지 않게 편리한 데이터 분석 도구입니다. SQL이 익숙한 당신을 위한 Query 문법을 사례를 통해 간단히 알아봅시다. 도움이 되셨다면 공감 꾸욱! 질문은 댓글로 언제든지! 단일 조건으로 필터링 df.query('Age > 30') # 'Age' 컬럼이 30보다 큰 모든 행을 선택합니다. 여러 조건으로 필터링 (AND, OR) df.query('Age > 30 & Gender == "male"') # 'Age'가 30보다 크고, 'Gender'가 'male'인 행을 선택합니다. df.query('Age 65') # 'Age'가..
2023.11.02