본문 바로가기

데이터분석

bartlett.test 등분산 검정

 

Data : energy (ISwR)

 

 

기존에 lean 과 obese의 분산을 보면 값이 퍼져있는 형태가 유사한 것을 볼 수 있습니다. 

이 경우에 두 개가 등분산이라고 이야기를 합니다. 

(데이터의 수가 적고 빨간색의 아웃라이어도 데이터)

기존 데이터


이번에는  빨간색의 값에 3배를 해보겠습니다. 

그 결과 lean이 퍼진 정도에 비하면 obese는 꽤 수축한 모습을 보입니다. 

이 경우에는 등분산이 아니다고 할 수 있습니다. 

fxnnxc 가 lean에 3배를 했다!

 

 


이제 bartlett.test 를 해보겠습니다.

H0(귀무가설) : 두 그룹의 분산은 같다. 

 

기존 데이터에 대한 bartlett.test
3배를 한 데이터에 대한 bartlett.test

분산이 비슷해 보이는 기존데이터에 대해서는 p-value = 0.712

따라서 기존데이터는 귀무가설을 기각할 수 없습니다. 두 그룹의 분산은 비슷하다고 할 수 있습니다. 

 

특정 그룹에 대해서 3배를 한 데이터에 대해서는 p-value = 0.008

따라서 수정한 데이터는 귀무가설을 기각하고 대립가설( 두 그룹의 분산은 다르다)을 채택합니다. 

 

 

'데이터분석' 카테고리의 다른 글

공공부문  (0) 2020.06.10
[차원축소][PCA의 원리] Principal component analysis  (0) 2020.02.06
R programming 비율 검정  (0) 2019.12.19
pairwise.t.test -- 집단 간 t.test  (0) 2019.12.19
ANOVA(2) - Two Way  (0) 2019.12.19