생물정보학5 Phasing 하기 Phasing 이란? 쉽게 말하면 나의 diploid 유전형을 아빠의 haploid와 엄마의 haploid로 구분해주는 과정 예) 나의 유전형이 1이라면 0|1 이런식으로 누구에게서 왔는지 알 수 있게 해줌. eagle이라는 툴을 사용하면 쉽게 할 수 있음 plink 파일(bed, bim, fam) 을 사용하여 수행해봄 ./Eagle/Eagle_v2.4.1/eagle --bfile {plink_file_name} --geneticMapFile ./Eagle/Eagle_v2.4.1/genetic_map_hg38_withX.txt --outPrefix {output_name} --numThreads 16 geneticMapFile은 Eagle 메뉴얼 페이지 가서 읽어보고 받아오면 됨. https://alke.. 2023. 12. 4. DNA 염기서열 분석 & Sanger sequencing - DNA 염기서열 분석 원리 DNA 복제는 주형 DNA에 상보적인 dNTP가 결합하여 이루어지는데 dNTP 대신에 ddNTP가 결합하면 DNA 복제가 중단되는 원리를 이용. dNTP : 기존에 있는 DNA의 마지막 nucleotide의 3번 탄소에 있는 -OH에 새로운 nucleotide의 인산기에 있는 H가 중합과정을 통해 결합되어 있는 모습 , 디옥시리보오스 2번 탄소에 H가 있고 3번탄소에는 OH가 있다. ddNTP : 디옥시리보오스의 2번과 3번 탄소에 H가 있다. (산소가 없다) : 이 경우 새로운 nucleotide의 인산기에 있는 H가 중합과정을 할 OH기가 없으므로 DNA 복제는 중단된다. - DNA 염기서열 분석에 필요한 요소 1. 단일가닥 DNA (주형) 2. DNA polymeras.. 2021. 4. 7. 서버에 anaconda 설치 & 주피터노트북 설치 www.anaconda.com/products/individual#download-section Anaconda | Individual Edition Anaconda's open-source Individual Edition is the easiest way to perform Python/R data science and machine learning on a single machine. www.anaconda.com 위의 링크로 들어가서 linux 64-bit instraller를 다운받는다. 다운 받을 파일에 마우스 우클릭 후 링크 주소 복사 --> 서버에서 wget 을 이용하여 받으면 됨 bash Anaconda3-2020.11-Linux-x86_64.sh 위 처럼 입력 하고 엔터를 계속 쳐주다가.. 2021. 2. 22. AUC 그려지는 원리? AUC 를 공부하기 전에 알아놓아야 할 것 True Control Disease Predict Control True Negative (TN) False Positive (FP) Disease False Negative (FN) True Positive (TP) 질병인 것을 질병이라고 예측하는 경우 Control이라고 예측한 것이 Control인 경우 1이라는 예측선을 그렸을 때 왼쪽은 CN, 오른쪽은 Disease라고 예측한다. 이 경우, Disease인 것을 Disease라고 잘 예측하기 때문에 sensitivity는 1이 된다. 반대로, Control (CN)은 맞추지 못하므로 specificity는 0이된다. 이런 식으로 threshold (예측선)이 점점 오른쪽으로 이동하며 그림을 그려주는것을 .. 2021. 2. 20. 이전 1 2 다음