본문 바로가기
통계

크롤리 통계 - 1.1

by BIJoy 2021. 1. 12.

예시) rectal cancer 치료약에 A와 B라는 약물이 있다. 이들 중 어떤 약물이 더 좋은지 판단해보자

1. subject가 2명이고 약물을 A와 B를 각 사람에게 처리한 후 반응을 보았을 때, A라는 약물에서는 반응이 있었고, B 약물에서는 반응이 없었다고 할 때 어떤 약물이 더 좋다고 할 수 있나??

--> 판단할 수 없다 : sample size가 2명으로 너무 작기 때문에

 

2. 1의 경우에서 sample size를 50명으로 늘렸다.

  A 약물 (30명) B 약물 (20명)
반응 있음 21 7
반응 없음 9 13

이 테이블을 보고 어떤 약이 좋은지 판단할 수 있나??

--> sample 갯수의 균형 , bias 및 confounding effect를 고려해야한다. 

 - sample 갯수의 균형

   sample 수가 3000, 2000명으로 늘어나면?? 추정이 더 정확해진다. 

   sample을 뽑는 것(sampling)은 모집단(population)에 대한 추정을 위해 뽑는 것이며, 더 많은 사람일수록 더 정확한다.

 - bias 및 confounding effect(교락효과)

   confounding effect : 반응변수에 영향을 줄 수 있는 나며지 요소이며, 내가 원치 않는 효과 

   --> 이 confounding effect를 보정해주어야 하며 이렇게 만드는 것을 실험디자인(실험설계) 라고 한다.

 

 

실험디자인(실험설계)

 

1. Randomization

2. Replication

 

A와 B의 rectal cancer에 대한 반응을 보려면 어떻게 디자인 해야할까??

- 모든  변동요소(unwanted effect)를 통제할 수는 없다. 

   --> sample size를 늘리는 것으로 극복한다. (적적한 sample size는 실험마다 다르다)

   --> sample size를 늘리게 되면 평균효과(averaging effect)를 볼 수 있다.

   

변동요소가 별로 없는 경우는 분산이 적어지면서 평균에 많이 몰려있는 그래프 형태를 보이고,

변동요소가 많은 경우 반응변수에 영향을 주는 것이 많기 때문에 분산이 커지면서 그래프가 퍼져있는 형태를 보인다.

                     분산에 따른 그래프의 모양                      분산이 클수록 그래프가 퍼진 모양이다.

 

모델이란??

어떤 현상을 잘 설명하기 위한 식

 

예제) 제2형당뇨병에 걸린 mouse model을 이용해서 insulin을 조절하는 약(C)의 효과를 보기 위해서는 어떻게 실험을 설계해야할까??

 

mouse model은 변동요소가 통제되기 때문에 sample size가 많지 않아도 된다. 따라서 sample size를 각각 3마리,3마리로 놓고 한쪽은 C를 투여한 그룹 다른 한쪽은 C를 투여하지 않은 그룹으로 나눠서 실험을 하면 C의 효과를 볼 수 있다. 

'통계' 카테고리의 다른 글

크롤리 통계 - 4.1 분산 복습  (0) 2021.01.19
크롤리 통계 - 4. 분산  (0) 2021.01.18
크롤리 통계 - 3. 중심경향  (0) 2021.01.12
크롤리 통계 - 2 (R, 데이터프레임)  (0) 2021.01.12
크롤리 통계 - 1. 기본적인 사항  (0) 2021.01.11