본문 바로가기
실험설계/일원배치법

고정효과 모형과 랜덤효과 모형에 대해

by be-favorite 2020. 3. 30.

❗️블로그 옮김:  https://www.taemobang.com

 

방태모

안녕하세요, 제 블로그에 오신 것을 환영합니다. 통계학을 전공으로 학부, 석사를 졸업했습니다. 현재는 가천대 길병원 G-ABC에서 Data Science를 하고있습니다. 통계학, 시계열, 통계적학습과 기계

www.taemobang.com

고정효과, 랜덤효과를 구분해야하는 이유는 EMS를 기반으로 수행되는 처리효과에 대한 검정통계량이 달라지기 때문이다. 단, 일원배치 분산분석에서는 두 모형의 EMS가 동일하여 검정통계량은 두 모형 모두 $MStrt$를 $MSE$를 나눈 형태로 주어진다. 즉, 일원배치 분산분석에서 고정효과든 랜덤효과든 분산분석 표의 작성은 동일하다.

 

○ 고정효과 모형(fixed effects model)

실험자 스스로 적당한 실험 수준을 선택한 경우이다. 이 경우 그 요인이 고정(fixed)되었다고 하며, 이에 대응되는 모형을 "고정효과 모형"이라고 부른다.

 

○ 랜덤효과 모형(random effects model)

가능한 모든 처리 수준 중에 랜덤하게 몇 개를 고르는 것이다. 이 경우 그 요인은 랜덤(random)이라 하며, 이에 대응되는 모형을 "랜덤효과 모형"이라고 부른다.

 

고정효과 모형과 랜덤효과 모형의 차이는 통계 추론의 범위에 있다. 랜덤효과 모형으로부터의 통계적 결론은 실험을 수행하지 않은 모든 수준들에까지도 확대 적용할 수 있으나, 고정효과 모형에서는 단순히 실험이 실제로 수행된 수준들에 한해서 통계적 결론이 유효하다. 단일 요인을 고려하는 CRD와 같은 모형에서는 고정효과, 랜덤효과 두 가지 모형이 존재할 수 있으나, 관심 요인 개수가 둘 이상인 설계의 경우에는 두 효과가 모두 존재하는 "혼합효과 모형(mixed effects model)"도 나타난다. 때때로 고정효과, 랜덤효과, 혼합효과 모형을 순서대로 각각 모형 I, 모형 II, 모형 III 로 부르기도 하며, "효과"를 빼고 단순히 고정 모형, 랜덤 모형, 혼합 모형이라 하기도 한다.

 

일원배치 분산분석에서는 랜덤효과 모형을 다음과 같이 쓸 수 있다. 처리효과를 확률변수로 고려하는 것이 아이디어이다.

 

$Y_{ij} = \mu + \tau_i + \epsilon_{ij}, \; \epsilon_{ij} \sim N(0, \sigma^2)\;, \; \tau_i \sim N(0, \sigma_{\tau}^2)$

 

고정효과 모형과 달리, 처리 수준 선택을 랜덤하게 수행하므로 $\tau_i$를 상수가 아닌 확률변수로서 고려한다. 또한 오차와는 서로 독립이다. 실험 전 $\tau_i$가 어떤 수준이 될지는 모르기 때문에, 확률변수로 고려하는 것은 당연하다. 위와 같은 모형을 따르면 $Y_{ij}$의 분산은 다음과 같이 주어진다.

 

$Var(Y_{ij}) = \sigma_{\tau}^2 + \sigma^2$

 

즉, 랜덤효과 모형에서 관측 자료의 분산은 처리 분산과 오차 분산 두 가지 요소로 이루어진다. 이런 관점에서 랜덤 모형을 분산요소 모형(components of variance model)이라고 부르기도 하며, 처리 분산과 오차 분산을 분산요소(variance components)라 부른다. 그럼 랜덤효과 모형에서 처리 효과의 유무를 검정하기위한 가설의 형태는 뭘까? 

 

$H_0 : \sigma_{\tau}^2 = 0 \;\; vs \;\; H_1 : \sigma_{\tau}^2 > 0$

 

즉, 랜덤하게 선택되는 어느 처리 수준에서든 그 효과에 전혀 차이가 없다면 모든 처리 효과들의 값이 동일할 것이고, 이경우 처리 효과의 분포의 분산은 0이 될 수 밖에 없다. 고정효과 모형과 랜덤효과 모형의 근본적 차이는 가설 설정과 결과 해석에 있으며, 자신이 가진 자료에서 어느 요인이 고정인지 랜덤인지는 사전에 요인 수준을 어떻게 결정했는지에 따라 결정된다. 또한, 고정이든 랜덤이든 분산분석표를 만들고 분석하는 과정에는 아무런 차이가 없다. 그러나, 관심 요인이 둘 이상인 분산분석 자료에서는 분산분석 표를 이용한 가설 검정에 큰 차이가 있다.

 

일원배치 분산분석의 랜덤효과 모형에 대한 EMS(Expected Mean Square : 기대평균제곱)는 다음과 같이 주어진다.

 

$E[MStrt] = \sigma^2 + r\sigma_{\tau}^2$

$E[MSE] = \sigma^2$

 

고정효과 모형의 EMS와 동일하다. 즉 처리 평균들 간 차이가 없다면 $\sigma_{\tau}^2$은 0이 되고, 그에 따라 $MStrt$와 $MSE$의 비로 주어지는 검정통계량 $F_0$는 1이 될 것이며 귀무가설을 기각시키지 못하게 된다. 반대로, 처리 평균들간 차이가 존재한다면 $\sigma_{\tau}^2 > 0$이 되므로 $F_0$는 1보다 커지게 되고, 귀무가설을 기각시킬 가능성이 높아진다.

 

끝으로 분산요소 $\sigma^2$과 $\sigma_{\tau}^2$ 들을 추정한다. 이는 EMS 관계식으로 가능하다:

 

$MSE = \hat{\sigma}^2$

$MStrt = \hat{\sigma^2 + r \sigma_{\tau}^2} = \hat{\sigma}^2 + r\hat{\sigma}_{\tau}^2$

 

즉, $\sigma_{\tau}^2$의 추정은 다음과 같이 주어진다.

 

$\sigma_{\tau}^2 = \frac{MStrt - MSE}{r}$

 

 

참고 문헌

성내경 (2012). 실험설계와 분석 2판. 자유아카데미

'실험설계 > 일원배치법' 카테고리의 다른 글

대비와 직교대비에 대해  (0) 2020.03.30
다중비교 검정법 소개  (0) 2020.03.30
불균형 자료에 대해  (0) 2020.03.22
오차항의 분산 추정과 EMS  (0) 2020.03.22
일원배치 분산분석의 원리  (0) 2020.03.20

댓글