중심경향 (Central tendancy)
왜 중심을 볼까??
이 집단의 특정 성격이 모이는 곳이 중심이므로 그것을 비교하기 위해서
- 최빈값(mode) : 가장 많이 관찰되는 값
: 히스토그램을 그려보면 최빈값을 찾을 수 있다.
- 산술평균 (mean)
중심 경향 중 하나
이상치의 영향을 많이 받기 때문에 극단적으로 크거나 작은 데이터가 산술평균의 결과에 큰 영향을 미칠수 있다.
이상치의 영향에 민감하지 않은 것은?? --> 중앙값
- 중앙값 (median)
이상치의 영향에 민감하지 않다
데이터에서 가운데에 위치한 값
cf) 중앙값을 함수로 만들어본다면?
데이터를 오름차순(작은 수에서 큰 수)으로 정렬 --> sort
데이터가 홀수개인지 짝수개인지 알아봄
위의 개수를 알아봤을때 홀수이면 그 보다 위의 정수를 가져옴 --> ceiling
- 기하평균 (geometric mean)
곱의 형식으로 진행되는 과정(배수의 형태인 경우, 1,2,4,8,16...)에서 사용
데이터를 모두 곱한 값의 n 제곱근
기하평균을 계산하는 또다른 방법 --> 로그 이용 --> 로그 값의 산술평균을 구함 --> 로그의 영향 제거를 위해 exp 적용
exp(mean(log(곱의형식데이터)))
곱의 형식으로 변화하는 데이터를 다룰 때에는 원래의 데이터에 로그를 적용해 그래프를 그려봐야 한다.
- 조화평균 (harmonic mean)
동일한 조건에서(동일한 거리, 동일한 금액) 비중이 다른 여러가지 요소를 결합하는 경우에 있어 평균을 도출하는데 사용된다.
주로 분모를 시간으로 가지는 측정값을 대상으로함
ex) 동일한 거리에서의 평균속력 구하기
역수의 평균을 구하고 그 역수를 계산
역수를 취한다 = 변화율을 본다 --> 이런 변화율의 평균을 보고자 할 때 조화평균을 사용
'통계' 카테고리의 다른 글
크롤리 통계 - 4.1 분산 복습 (0) | 2021.01.19 |
---|---|
크롤리 통계 - 4. 분산 (0) | 2021.01.18 |
크롤리 통계 - 2 (R, 데이터프레임) (0) | 2021.01.12 |
크롤리 통계 - 1.1 (0) | 2021.01.12 |
크롤리 통계 - 1. 기본적인 사항 (0) | 2021.01.11 |