Data : energy (ISwR)
기존에 lean 과 obese의 분산을 보면 값이 퍼져있는 형태가 유사한 것을 볼 수 있습니다.
이 경우에 두 개가 등분산이라고 이야기를 합니다.
(데이터의 수가 적고 빨간색의 아웃라이어도 데이터)
이번에는 빨간색의 값에 3배를 해보겠습니다.
그 결과 lean이 퍼진 정도에 비하면 obese는 꽤 수축한 모습을 보입니다.
이 경우에는 등분산이 아니다고 할 수 있습니다.
이제 bartlett.test 를 해보겠습니다.
H0(귀무가설) : 두 그룹의 분산은 같다.
분산이 비슷해 보이는 기존데이터에 대해서는 p-value = 0.712
따라서 기존데이터는 귀무가설을 기각할 수 없습니다. 두 그룹의 분산은 비슷하다고 할 수 있습니다.
특정 그룹에 대해서 3배를 한 데이터에 대해서는 p-value = 0.008
따라서 수정한 데이터는 귀무가설을 기각하고 대립가설( 두 그룹의 분산은 다르다)을 채택합니다.
'데이터분석' 카테고리의 다른 글
공공부문 (0) | 2020.06.10 |
---|---|
[차원축소][PCA의 원리] Principal component analysis (0) | 2020.02.06 |
R programming 비율 검정 (0) | 2019.12.19 |
pairwise.t.test -- 집단 간 t.test (0) | 2019.12.19 |
ANOVA(2) - Two Way (0) | 2019.12.19 |