AUC 를 공부하기 전에 알아놓아야 할 것
True | |||
Control | Disease | ||
Predict | Control | True Negative (TN) | False Positive (FP) |
Disease | False Negative (FN) | True Positive (TP) |
질병인 것을 질병이라고 예측하는 경우
Control이라고 예측한 것이 Control인 경우
1이라는 예측선을 그렸을 때 왼쪽은 CN, 오른쪽은 Disease라고 예측한다.
이 경우, Disease인 것을 Disease라고 잘 예측하기 때문에 sensitivity는 1이 된다.
반대로, Control (CN)은 맞추지 못하므로 specificity는 0이된다.
이런 식으로 threshold (예측선)이 점점 오른쪽으로 이동하며 그림을 그려주는것을 AUC 이다.
예측선이 2에 왔다고 해보자 이 경우 CN을 CN이라고 예측하고, Disease를 Disease라고 잘 예측하므로 sensitivity와 specificity가 각각 1이 된다.
위의 그림을 보자
1의 경우에는 sensitivity =1, specificity =0이다
2의 경우,
예측선이 2의 위치에 올때까지 sensitivity는 계속 1이며, specificity는 0에서 부터 점점 올라간다.
그리고 2의 위치가 되면서부터 sensitivity는 점점 떨어지게 된다.
AUC를 그리면서 가끔 x축과 y축의 의미를 잘 이해하지 못하는 경우가 있다~
다음과 같은 원리를 이해한 후에 AUC를 그린다면 좋을 것 같다.
'생물정보학' 카테고리의 다른 글
Phasing 하기 (0) | 2023.12.04 |
---|---|
DNA 염기서열 분석 & Sanger sequencing (0) | 2021.04.07 |
서버에 anaconda 설치 & 주피터노트북 설치 (0) | 2021.02.22 |
CEL 파일을 vcf , plink format 파일로 만들기 (0) | 2021.01.25 |