본문 바로가기

데이터분석

pairwise.t.test -- 집단 간 t.test 이번에는 t.test를 여러 집단에 대해서 사용하는 방법에 대하여 배워보겠습니다. Data : red.cell.folate ( ISwR package에 있어요) EDA obs 22 : 총 관찰 갯수는 22개입니다. ventilation : 3개의 그룹으로 나눌 수 있습니다. NO.. , N20,, 이름은 중요하지 않아요. PAIRWISE.T.TEST 코드 : with(red.cell.folate, pairwise.t.test(folate, ventilation, pool.sd=F)) pairwise.t.test는 그룹으로 나눠서 각각의 t.test를 진행하고 p-value의 값을 반환해줍니다. p-value값이 낮다면 두 그룹의 평균이 다른 것으로, 높다면 비슷한 것으로 생각할 수 있습니다. (귀무가설:.. 더보기
ANOVA(2) - Two Way Data : heart.rate EDA 데이터를 살펴보겠습니다. 컬럼이 3개이고 36개의 관측값이 있습니다. hr은 숫자이고 subj 와 time은 Factor 입니다. Anova 귀무가설 : 그룹별로 hr 값 평균에 대해서 차이가 없다. subj 의 Pr ~ 0 time 의 Pr ~0.18 둘 다 0에 가까움으로 두 그룹 모두에 대해서 귀무가설을 기각할 수 있습니다. 1. subj에 대해서 나눈 그룹에 대해서 hr 평균값에 차이가 있다. 2. time에 대해서 나눈 그룹에 대해서 hr 평균값에 차이가 있다. with(heart.rate, interaction.plot(time, subj, hr), ordered(time)) 코드를 통해 시각화를 해봅시다. 더보기
ANOVA (1) - One way A ANOVA( Analysis of Varaiance) - One way Data : energy library(ISwR)에는 다량의 데이터가 있는데 그 중에 energy 데이터를 가지고 One Way Anova에 대해서 알아보겠습니다. EDA expend 컬럼의 경우, 최솟값은 6.130 그리고 최댓값은 12.70입니다. stature 컬럼의 경우, factor 값으로 lean 과 obese 두 개의 인자가 있습니다. Anova Anova의 귀무가설은 "그룹별로 평균이 모두 동일하다"입니다. 따라서 P-Value가 낮게 나온다면 그룹 중에 평균이 다른 게 적어도 하나 존재한다고 생각할 수 있습니다. DF (2-1) = 1 = (group 수 - 1) Sum Sq 잔차들을 모두 제곱한 값을 더한 값 Mea.. 더보기
Cor.test R programming 상관관계 분석 "키가 크면 몸무게도 크다" 이 문장은 두 가지 변수의 관계를 나타내고 있습니다. 키, 몸무게. 두 개는 어떤 관계가 있을까요? 대부분의 경우, 키가 크면 그에 따라 몸무게가 많이 나갑니다. 이를 양의 상관관계라고 이야기를 하고 반대로 키가 클수록 몸무게가 적게 나간다면 이를 음의 상관관계라고 이야기를 합니다. 상관관계를 알아보는 방법을 R Programming을 통해서 배워봅시다. 데이터를 이용해서 cor.test를 하면 상관계수 : 0.9 P-value : 거의 0 P- value가 상당히 낮으므로 귀무가설을 기각할 수 있습니다. 그런데 여기서 귀무가설은 무엇일까요? cor.test 그림을 보시면 "alternative hypothesis : true correlation is not equal to.. 더보기