분류 전체보기
-
001 폴더를 순회하면서 모든 파일을 찾고 공통적인 액션을 적용하기 find . -name "*DATA*.csv" -print0 | xargs -0 git rm --cached find . -name "*.csv": 현재 디렉토리(.)와 모든 하위 디렉토리에서 .csv로 끝나는 모든 파일을 탐색 -print0: 각 파일 이름 뒤에 null 문자를 추가 |: find 명령어의 출력을 xargs 명령어로 파이프 xargs -0: 입력으로 들어온 내용을 null 문자로 구분된 아이템으로 처리 git rm --cached: find 명령어의 각 출력(여기서는 .csv 파일들)에 대해 git rm --cached 명령을 실행
[GIT] #005 기타 BASH 명령어001 폴더를 순회하면서 모든 파일을 찾고 공통적인 액션을 적용하기 find . -name "*DATA*.csv" -print0 | xargs -0 git rm --cached find . -name "*.csv": 현재 디렉토리(.)와 모든 하위 디렉토리에서 .csv로 끝나는 모든 파일을 탐색 -print0: 각 파일 이름 뒤에 null 문자를 추가 |: find 명령어의 출력을 xargs 명령어로 파이프 xargs -0: 입력으로 들어온 내용을 null 문자로 구분된 아이템으로 처리 git rm --cached: find 명령어의 각 출력(여기서는 .csv 파일들)에 대해 git rm --cached 명령을 실행
2024.01.22 -
안녕하세요 데잇입니다. Poetry 가상환경을 설정하는 방법은 지난 시간에 이미 다루었습니다. 가상환경을 설정하는 이유는 크게 다음과 같습니다. 프로젝트 격리: Poetry 가상환경을 사용하면 프로젝트별로 격리된 환경을 생성할 수 있으며, 이는 프로젝트 간에 종속성 충돌을 방지하고 프로젝트 간에 독립적으로 패키지를 관리할 수 있게 합니다. 패키지 버전 관리: Poetry 가상환경은 poetry.lock 파일을 통해 사용 중인 패키지의 정확한 버전을 고정하므로, 프로젝트의 일관성을 유지하고 다른 환경에서 동일한 종속성을 재현하는 데 도움을 줍니다. 종속성 설치 및 업데이트: Poetry 가상환경을 사용하면 poetry install 명령어를 통해 종속성을 쉽게 설치하고 관리할 수 있으며, 이를 통해 필요한..
[파이썬 훈련] #007 Python 가상환경 Poetry 환경 이전 및 버전설정안녕하세요 데잇입니다. Poetry 가상환경을 설정하는 방법은 지난 시간에 이미 다루었습니다. 가상환경을 설정하는 이유는 크게 다음과 같습니다. 프로젝트 격리: Poetry 가상환경을 사용하면 프로젝트별로 격리된 환경을 생성할 수 있으며, 이는 프로젝트 간에 종속성 충돌을 방지하고 프로젝트 간에 독립적으로 패키지를 관리할 수 있게 합니다. 패키지 버전 관리: Poetry 가상환경은 poetry.lock 파일을 통해 사용 중인 패키지의 정확한 버전을 고정하므로, 프로젝트의 일관성을 유지하고 다른 환경에서 동일한 종속성을 재현하는 데 도움을 줍니다. 종속성 설치 및 업데이트: Poetry 가상환경을 사용하면 poetry install 명령어를 통해 종속성을 쉽게 설치하고 관리할 수 있으며, 이를 통해 필요한..
2024.01.21 -
안녕하세요, 데잇입니다. 오늘은 git을 더 가볍게 관리하기 위한 기법으로 gitignore를 다루는 방법을 알아보겠습니다. .gitignore 파일 활용법: 기본부터 고급 활용까지 .gitignore 파일에 기록된 내용을 토대로 Git에서 버전 관리에서 제외할 파일/디렉토리나 포함할 파일/디렉토리를 지정할 수 있다. .gitignore 1. 무시하기 다양한 방식으로 무시할 수 있다. secret.txt # 파일 무시 *.log # 확장자 무시 node_modules/ # 루트 디렉토리 아래 해당 디렉토리 무시 /folder_a/todo.txt # 루트 디렉토리 아래 해당 디렉토리 내 해당 파일만 무시 *temp* # * : 임의의 여러($\ge0$) 문자 ?.txt # ? : 임의의 한 문자 [abc]..
[GIT] #003 야, git. 쟤는 무시해! .gitignore안녕하세요, 데잇입니다. 오늘은 git을 더 가볍게 관리하기 위한 기법으로 gitignore를 다루는 방법을 알아보겠습니다. .gitignore 파일 활용법: 기본부터 고급 활용까지 .gitignore 파일에 기록된 내용을 토대로 Git에서 버전 관리에서 제외할 파일/디렉토리나 포함할 파일/디렉토리를 지정할 수 있다. .gitignore 1. 무시하기 다양한 방식으로 무시할 수 있다. secret.txt # 파일 무시 *.log # 확장자 무시 node_modules/ # 루트 디렉토리 아래 해당 디렉토리 무시 /folder_a/todo.txt # 루트 디렉토리 아래 해당 디렉토리 내 해당 파일만 무시 *temp* # * : 임의의 여러($\ge0$) 문자 ?.txt # ? : 임의의 한 문자 [abc]..
2024.01.19 -
안녕하세요, 데잇입니다. git에 익숙하지 않은 데이터과학자를 위한 git 초급 교실입니다. 오늘은 git과 github을 연결하는 과정을 살펴봅니다. 계정설정 지난 글(한 컴퓨터 여러 계정 연동하기) 참조 GIT - GITHUB 연결 Link git remote add origin git@github.com-acc2:acc2_username/reponame.git # 생성시 git remote set-url origin git@github.com-acc2:acc2_username/reponame.git # 변경시 Un Link git remote rm origin Check git remote -v 활용사례 간단한 활용사례를 살펴봅니다. github repo 설정 #1. 먼저 원격 저장소에 new re..
[GIT] #002 GITHUB 연결과 변경안녕하세요, 데잇입니다. git에 익숙하지 않은 데이터과학자를 위한 git 초급 교실입니다. 오늘은 git과 github을 연결하는 과정을 살펴봅니다. 계정설정 지난 글(한 컴퓨터 여러 계정 연동하기) 참조 GIT - GITHUB 연결 Link git remote add origin git@github.com-acc2:acc2_username/reponame.git # 생성시 git remote set-url origin git@github.com-acc2:acc2_username/reponame.git # 변경시 Un Link git remote rm origin Check git remote -v 활용사례 간단한 활용사례를 살펴봅니다. github repo 설정 #1. 먼저 원격 저장소에 new re..
2024.01.18 -
안녕하세요 데잇입니다. 오늘도 이전처럼 확률분포를 마을에 살고 있는 사람으로 이미지화해 익숙해지는 과정입니다. 오늘 만나볼 분포는 푸아송 분포로 부터 도출되는 지수 분포입니다. 지수 분포(Exponential distribution)는 푸아송 가정을 따르는 사건이 한 번 발생하기 까지 걸리는 시간(간격)에 대한 분포입니다. 우리는 그녀를 푸아송 분포의 첫사랑이자 소꿉친구인 검은머리 소녀, 지수로 생각합시다! 그녀는 시간 계산이 철저한 J형 성격입니다. • 정의: $X \sim \lambda {exp}^{-\lambda x}$ • 의미: 발생율이 시간에 따라 고정된 사건이 한 번 발생하기 까지 걸리는 시간에 대한 분포 • 특성: Memory Less • 관련분포: 푸아송분포 $\rightarrow$ 지수분..
[확률분포 마을] #005 연속형 확률분포: 지수분포안녕하세요 데잇입니다. 오늘도 이전처럼 확률분포를 마을에 살고 있는 사람으로 이미지화해 익숙해지는 과정입니다. 오늘 만나볼 분포는 푸아송 분포로 부터 도출되는 지수 분포입니다. 지수 분포(Exponential distribution)는 푸아송 가정을 따르는 사건이 한 번 발생하기 까지 걸리는 시간(간격)에 대한 분포입니다. 우리는 그녀를 푸아송 분포의 첫사랑이자 소꿉친구인 검은머리 소녀, 지수로 생각합시다! 그녀는 시간 계산이 철저한 J형 성격입니다. • 정의: $X \sim \lambda {exp}^{-\lambda x}$ • 의미: 발생율이 시간에 따라 고정된 사건이 한 번 발생하기 까지 걸리는 시간에 대한 분포 • 특성: Memory Less • 관련분포: 푸아송분포 $\rightarrow$ 지수분..
2024.01.15 -
안녕하세요, 데잇입니다! Github에 계정을 연결하는 방법에는 HTTPs, SSH Key방법 두 가지가 있습니다. 여기에서는 그 중 SSH Key방법을 이용해 한 컴퓨터에서 두개 이상의 Github계정을 연동하여 사용하는 설정을 알아봅시다. SSK Key (로컬)생성 및 (깃헙)지정 (선택) ~/.ssh에 있는 기존 SSH Key를 삭제합니다. 새로운 SSH Key(private & public)를 발급합니다. ssh-keygen -t rsa -b 4096 -C "account1@gmail.com" ssh-keygen -t rsa -b 4096 -C "account2@gmail.com" 이때, 파일명은 각각 ~/.ssh/id_rsa, ~/.ssh/id_rsa_acc2으로 저장합니다. ssh-agent를..
[GIT] #001 한 컴퓨터 여러 계정 연동하기안녕하세요, 데잇입니다! Github에 계정을 연결하는 방법에는 HTTPs, SSH Key방법 두 가지가 있습니다. 여기에서는 그 중 SSH Key방법을 이용해 한 컴퓨터에서 두개 이상의 Github계정을 연동하여 사용하는 설정을 알아봅시다. SSK Key (로컬)생성 및 (깃헙)지정 (선택) ~/.ssh에 있는 기존 SSH Key를 삭제합니다. 새로운 SSH Key(private & public)를 발급합니다. ssh-keygen -t rsa -b 4096 -C "account1@gmail.com" ssh-keygen -t rsa -b 4096 -C "account2@gmail.com" 이때, 파일명은 각각 ~/.ssh/id_rsa, ~/.ssh/id_rsa_acc2으로 저장합니다. ssh-agent를..
2024.01.14 -
안녕하세요 데잇입니다. 이제 확률분포 마을에는 무뚝뚝한 할아버지 개발자(베르누이 분포)와 할아버지 개발자를 똑 닮은 무뚝뚝한 쌍둥이(이항 분포)가 살고 있습니다. 오늘 만나볼 분포는 푸아송 분포로 대표적인 이산형 확률분포 입니다. 단속적으로 끊어지는 개발자의 형상을 지닌 세 번째 주민이죠. 그 주민들 중에서도 가장 힙한 인물입니다. 포아송 분포는 포아송 과정, 지수분포 등 활용법이 다양하기 때문입니다. 푸아송 분포(Poisson distribution)는 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산확률분포 입니다. 우리는 그를 동그란 안경을 쓴 대머리 청년 개발자로 상상하기로 합시다! • 정의: $X \sim e^{-\lambda}\frac{\lambda^x}{x!}, x = {0,..
[확률분포 마을] #004 이산형 확률분포: 푸아송 분포안녕하세요 데잇입니다. 이제 확률분포 마을에는 무뚝뚝한 할아버지 개발자(베르누이 분포)와 할아버지 개발자를 똑 닮은 무뚝뚝한 쌍둥이(이항 분포)가 살고 있습니다. 오늘 만나볼 분포는 푸아송 분포로 대표적인 이산형 확률분포 입니다. 단속적으로 끊어지는 개발자의 형상을 지닌 세 번째 주민이죠. 그 주민들 중에서도 가장 힙한 인물입니다. 포아송 분포는 포아송 과정, 지수분포 등 활용법이 다양하기 때문입니다. 푸아송 분포(Poisson distribution)는 단위 시간 안에 어떤 사건이 몇 번 발생할 것인지를 표현하는 이산확률분포 입니다. 우리는 그를 동그란 안경을 쓴 대머리 청년 개발자로 상상하기로 합시다! • 정의: $X \sim e^{-\lambda}\frac{\lambda^x}{x!}, x = {0,..
2024.01.12 -
안녕하세요 데잇입니다. 단순하지만, 모르면 곤란을 겪는 SQL 문법을 정리합니다! 이 글은 지속적으로 업데이트 됩니다. CTE를 이용해 상수값 생성하여 사용하기 다른 테이블로 부터 계산한 결과를 상수로 사용하고 싶을때 -- 첫 번째 CTE: 일별 총 판매액 계산 WITH DailySales AS ( SELECT DATE(sale_date) as SaleDate, SUM(amount) as TotalAmount FROM sales_table GROUP BY SaleDate ), -- 두 번째 CTE: 평균 판매액 계산 AVGSALES AS ( SELECT AVG(TotalAmount) as AverageAmount FROM DailySales ), -- 최종 쿼리: 특정 날짜의 판매 성과 비교 FinalA..
[빅쿼리 훈련] #002 간단한 SQL 활용법안녕하세요 데잇입니다. 단순하지만, 모르면 곤란을 겪는 SQL 문법을 정리합니다! 이 글은 지속적으로 업데이트 됩니다. CTE를 이용해 상수값 생성하여 사용하기 다른 테이블로 부터 계산한 결과를 상수로 사용하고 싶을때 -- 첫 번째 CTE: 일별 총 판매액 계산 WITH DailySales AS ( SELECT DATE(sale_date) as SaleDate, SUM(amount) as TotalAmount FROM sales_table GROUP BY SaleDate ), -- 두 번째 CTE: 평균 판매액 계산 AVGSALES AS ( SELECT AVG(TotalAmount) as AverageAmount FROM DailySales ), -- 최종 쿼리: 특정 날짜의 판매 성과 비교 FinalA..
2024.01.09