IT정보

뒤로가기

[데이터분석] 분산분석 살펴보기

5점
2021-12-10 23:26:21 추천 1

분산분석을 살펴보자



1. 분산분석(ANOVA, analysis of variance)


세 집단 이상의 평균을 비교할 때 사용합니다. 분산을 계산할 때처럼 편차의 제곱합을 해당 자유도로 나누어서 얻는 값을 이용하여 분석합니다. 예를 들어서 A매장과 B매장과 C매장의 매출 평균이 차이가 있는가에 대한 분석은 분산분석으로 진행할 수 있습니다. 


만약 P-value가 유의수준 알파보다 작게 나와서 귀무가설을 기각하게 되면 평균의 차이가 있는 것이라 판단할 수 있습니다. 그럼 이제 세 집단 중 어떤 집단에서 차이가 발생한 것인지 관심을 가지게 될 것이고 이때 다중비교를 사용합니다. 


참고: 분산 분석중에서 하나의 범주형 독립변수에 따른 수치형 종속변수의 평균차이를 검정 하는 것을 일원분산분석(one-way ANOVA)



2. 다중비교


분산분석에서 요인 수준별 평균이 같지 않은 경우에 요인의 어떤 수준 간 차이 때문인지 파악하고자 할 때 사용합니다. 다중비교로 사용하는 검정은 투키 HSD 검정입니다. 투키 HSD검정은 모든 가능한 두 수준의 평균간의 차이가 있는지 검정하는 것입니다. 


위의 예에서는 A와B, A와C, B와C의 경우를 분석하여 나타내줍니다.


비밀번호 입력후 수정 혹은 삭제해주세요.


댓글목록

등록된 댓글이 없습니다.
댓글 수정 댓글 수정
0/500 byte
댓글쓰기 댓글쓰기

영문 대소문자/숫자/특수문자 중 2가지 이상 조합, 10자~16자

0/500 byte
평점

위에 보이는 문자를 공백없이 입력하세요. (대소문자구분)

에게만 댓글 작성 권한이 있습니다.