Colitis Model 준비 : DSS & AOM- induced Colitis > 자유게시판

본문 바로가기

회원메뉴

Colitis Model 준비 : DSS & AOM- induced Colitis

페이지 정보

작성자 Ethan 댓글 0건 조회 5회 작성일 24-03-03 08:25

본문

다층모형, https://i-model-h0use.com 혼합모형(mixed model)분석 - animal data와 lmer()함수 결과의 해석​mixed model은 데이터의 평균뿐만 아니라 분산과 공분산을 모델링을 하는 기법이다. Mixed models use both fixed and random effects. These correspond to a hierarchy of levels with the repeated, correlated measurement occurring among all of the lower level units for each particular upper level unitstat.cmu.edu/~hseltman/309/Book/chapter15.pdfLMM(Linear Mixed Model): 다층모형(혼합모형)의 종속변수데이터의 형태 ​다양한 개인에 대한 다변량 측정: (예: 사람의 혈압, 지방 등이 상관 관계가 있음)군집 측정: (예: 같은 가족에 속한 사람들의 혈압 측정은 상관 관계가 있을 수 있음).반복 측정: (예: 시간 경과에 따른 콜레스테롤 측정은 상관 관계가 있을 수 있음) 처음에 처리가 적용된 실험 물질에 대해 데이터가 반복적으로 수집되면 데이터는 반복된 측정입니다.&quot(Schabenberger 및 Pierce 2001)종적 데이터: (예: 시간 경과에 따라 추적된 개인의 콜레스테롤은 상관관계가 있음): 관찰 연구에서 시간이 지남에 따라 반복적으로 수집된 데이터를 종단이라고 합니다.&quot(Schabenberger 및 Pierce 2001)공간 데이터: (예: 같은 동네에 사는 개인의 측정은 상관 관계가 있음)​혼합선형 모델(다층모형)에서 설명하는 것은 2가지이다. 고정효과에 대한 것과 개별 변동을 나타내는 랜덤효과 혹은 종속오류, 혹은 상관오류를 암시하는 자동상관효과등이다(Random effects representing individual variation or auto correlation/spatial effects that imply dependent (correlated) error).[1]​​​데이터의 구성 구조는 다음과 같다. 전체 데이터이다. ​​#시각화 ​기술통계 JWileymisc의 egltable은 데이터를 정리하는데 추가적으로 통계적인 검증을 할 수 있는 특징이 있어서 데이터의 기술통계를 정리하면서 이들 간에 ANVOA 분석으로 차이가 있는지 확인한 것이다. anova검정결과, 유의한 차이가 나타났다. F(4, 35) ϓ.01, p =.031​​변수간 관계 시각화 각 그룹별로 산점도와 회귀직선을 그려보고 데이터를 파악하는 https://i-model-h0use.com 방법을 설명한 것이다. 각 그룹별로 어떤 특징을 가진 것인지 한눈에 파악하기 유리하다. ​평균중심화 이 부분은 데이터의 평균중심화하는 방법을 설명하여 추가했다. ​2. 혼합모형 분석과 해석 ​혼합효과 모델을 세우는 방법은 다음과 같다. 먼저, 반응변수와 설명변수를 결정하고, 설명변수 중에서 고정효과와 무작위효과를 구분한다. 고정효과는 주요 관심 대상이고 실험을 반복하면 다시 사용할 수 있는 수준을 가지고 있는 변수이고, 무작위효과(랜덤효과)는 주요 관심 대상이 아니고 많은 수준 중에서 무작위로 선택된 것으로 간주되는 변수이다. 예를 들어, 개체, 배치, 교실 등이 무작위효과가 될 수 있다. 무작위효과는 반응변수의 평균과 분산에 영향을 미칠 수 있으므로, 무작위효과의 수준 간에 평균에 차이가 있는지 검정하고, 분산 구조를 모델링한다.​null model은 반응변수와 무작위효과만을 포함하는 모델이다. 이 모델은 반응변수의 평균이 무작위효과의 수준에 따라 변하는지를 검정한다. null model은 다음과 같은 수식으로 표현할 수 있다.​yij​ =β0​ + bi​ + ϵij​​여기서 yij​는 i번째 무작위효과 수준에서 j번째 관측값을 나타내고, β0​는 전체 평균을 나타낸다. bi​는 i번째 무작위효과 수준의 편차를 나타내고, ϵij​는 i번째 무작위효과 수준에서 j번째 관측값의 편차를 나타낸다. bi​와 ϵij​는 모두 정규분포를 따르고, 서로 독립이라고 가정한다. null model은 R에서 lme4 패키지의 lmer 함수를 사용하여 다음과 같이 적합할 수 있다. 여기서 y는 반응변수의 이름이고, random은 무작위효과의 이름이다. data는 데이터 프레임의 이름이다.​​다음은, 고정효과와 무작위효과 모델은 반응변수와 고정효과, 무작위효과를 모두 포함하는 모델이다. 이 모델은 반응변수의 평균이 고정효과와 무작위효과의 수준에 따라 변하는지를 검정하고, 고정효과와 무작위효과의 상호작용을 고려할 수도 있다. 고정효과와 무작위효과 모델은 다음과 같은 수식으로 표현할 수 있다.​yijk​ =β0 ​+ β1​xijk​ + bi ​+ bix​xijk ​+ ϵijk​ https://i-model-h0use.com 여기서 yijk​는 i번째 무작위효과 수준과 k번째 고정효과 수준에서 j번째 관측값을 나타내고, β0​는 전체 평균을 나타낸다. β1​은 고정효과의 기울기를 나타내고, xijk​는 i번째 무작위효과 수준과 k번째 고정효과 수준에서 j번째 관측값의 고정효과 수준을 나타낸다. bi​는 i번째 무작위효과 수준의 편차를 나타내고, bix​는 i번째 무작위효과 수준의 고정효과 기울기의 편차를 나타낸다. ϵijk​는 i번째 무작위효과 수준과 k번째 고정효과 수준에서 j번째 관측값의 편차를 나타낸다. bi​, bix​, ϵijk​는 모두 정규분포를 따르고, 서로 독립이라고 가정한다. 고정효과와 무작위효과 모델은 R에서 lme4 패키지의 lmer 함수를 사용하여 다음과 같이 적합할 수 있다.여기서 y는 반응변수의 이름이고, x는 고정효과의 이름이다. random은 무작위효과의 이름이다. data는 데이터 프레임의 이름이다. (x | random)은 무작위효과(랜덤효과)의 수준에 따라 절편과 기울기가 변하는 것을 나타낸다.​​​​2.1. 기본모델의 설정 후 분석 weight ~ (1 | sire)는 weight라는 반응변수가 sire라는 무작위효과에 의해 영향을 받는다는 것을 의미한다. sire는 동물의 부모를 나타내는 변수이다. 이 모델은 sire의 수준 간에 weight의 평균에 차이가 있는지 검정하는 모델이다. null모델로서 일단은 가장 간단한 모습에서 해석을 해보려고 한다. REML criterion at convergence: 358.2​REML criterion at convergence는 REML 방법으로 추정한 모델의 적합도를 나타내는 값이다. 이 값이 작을수록 모델이 데이터에 잘 적합되었다고 볼 수 있다. 현재 모델은 358.2을 나타내고 있다. ​​Scaled residuals: Min 1Q Median 3Q Max-1.9593 -0.7459 -0.1581 0.8143 1.9421​Scaled residuals는 표준화된 잔차의 요약 통계량이다. 잔차는 관측값과 예측값의 차이를 나타내는 값이다. 표준화된 잔차는 평균이 0이고 표준편차가 1인 정규분포를 따르도록 변환된 잔차인데, 표준화된 잔차의 범위가 너무 크거나 작지 않으면 모델이 적절하다고 판단할 수 있습니다[2]​​​고정효과의 해석 ​Fixed https://i-model-h0use.com effects: Estimate Std. Error df t value Pr(>|t|)(Intercept) 82.550 5.911 4.000 13.96 0.000153 ***​Fixed effects는 고정효과의 추정값, 표준오차, 자유도, t-검정 통계량, p-값을 보여준다. 이 모델에서는 고정효과가 없으므로 절편만 보여주고있다. 절편은 sire의 무작위효과가 0일 때 weight의 평균을 나타내는 값이다. 절편의 추정값은 82.55이고 표준오차는 5.91이며, t-검정 통계량은 13.96이고 p-값은 0.000153이므로, 이는 절편이 0과 유의하게 다르다는 것을 의미한다. 즉, sire의 무작위효과가 0일 때 weight의 평균이 0이 아니라는 것을 나타내는 것이다. ​​​랜덤효과의 해석 ​Random effects: Groups Name Variance Std.Dev. sire (Intercept) 116.7 10.81 Residual 463.8 21.54Number of obs: 40, groups: sire, 5​Random effects는 무작위효과의 분산과 표준편차를 보여준다. sire의 무작위효과는 weight의 평균에 116.7의 분산과 10.81의 표준편차를 가지고 있다. 잔차의 분산은 463.8이고 표준편차는 21.54로 나타나있다. 무작위효과의 분산이 0에 가까우면 무작위효과가 반응변수에 영향을 미치지 않는다고 해석할 수 있다.이때의 급내상관계수를 구해보면 다음과 같다. 아래는 ICC함수를 사용했다[3] 116.7/(116.7 + 465.8) = 0.2003433​참고 ICC는 여기에서 mlmhelpr 패키지를 이용하여 게산하는 방법도 있다. 필자의 경우는 Reference에 제시한 것처럼 분석하는 함수를 만들어서 분석하는 중이다. ​Random Effect Examination랜덤효과의 조사는 exactRLRT()를 이용하여 하게 된다. 가설은 아래와 같다. H0는 랜덤효과의 분산이 0이라고 가정한다. Since the p-value is significant, we reject H0이로서 우리는 랜덤 효과가 유의하다는 사실을 알게 되었다. ​​​고정효과와 무작위효과 모델의 결과보고고정효과와 무작위효과 모델의 결과보고는 다음과 같은 순서로 진행할 수 있다.모델의 적합도를 평가하는 기준을 보고한다. 예를 들어, AIC, BIC, 로그우도, deviance 등이 있다. 이 값들이 작을수록 모델이 데이터에 잘 적합되었다고 볼 수 있다.고정효과의 추정값, 표준오차, 자유도, t-검정 https://i-model-h0use.com 통계량, p-값을 보고한다. 고정효과의 유의성과 크기를 해석하고, 고정효과 간의 상호작용이 있는지 여부를 보고한다.무작위효과의 분산과 표준편차를 보고한다. 무작위효과의 유의성과 크기를 해석하고, 무작위효과 간의 급내상관관계를 보고한다. 무작위효과의 분산이 0에 가까우면 무작위효과가 반응변수에 영향을 미치지 않는다고 해석할 수 있다.모델의 특이성이나 수렴여부를 보고한다. 특이성이나 수렴문제가 발생하면 모델의 추정이 불안정하고 신뢰할 수 없다고 해석할 수 있다. 따라서, 모델을 수정하거나 다른 모델을 사용하는 것이 좋다.​​예시자료 “We fitted a linear mixed model with time, treatment, and axis as fixed effects, and ID as a random effect. We used the lmer function in the lme4 package in R to estimate the model parameters by restricted maximum likelihood (REML). The model fit was assessed by the Akaike information criterion (AIC) and the Bayesian information criterion (BIC), which were 367.8 and 379.6, respectively.”“The fixed effects estimates, standard errors, degrees of freedom, t-values, and p-values are shown in Table 1. The intercept represents the mean square root amplitude for treatment 1 at time 6 on axis 1. There were significant main effects of time (p 0.05).”“The random effects variances and standard deviations are shown in Table 2. The random intercept variance for ID was 116.7, with a standard deviation of 10.81. This means that there was significant variation in the square root amplitude among different IDs, after accounting for the fixed effects. The residual variance was 463.8, with a standard deviation of https://i-model-h0use.com 21.54. This means that there was significant variation in the square root amplitude within IDs, after accounting for the fixed effects. There were no random slopes for ID, as they were not included in the model.”“The model did not show any signs of singularity or convergence problems, indicating that the model estimates were reliable and stable.”​​3. 임의로 설정한 모델 이 모델에서는 고정효과와 랜덤효과에 같은 변수를 넣어보았다. sire의 무작위효과는 weight의 평균에 0의 분산과 0의 표준편차를 가지고 있다. 이는 sire의 무작위효과가 반응변수에 영향을 미치지 않는다는 것을 의미한다. 잔차의 분산은 405.8이고 표준편차는 20.14이다.​이 모델에서는 sire의 수준을 고정효과로 취급하였다. 절편은 sire의 수준이 1일 때 weight의 평균을 나타낸다. 절편의 추정값은 83.625이고 표준오차는 7.122이다. t-검정 통계량은 11.741이고 p-값은 1.55e-14이다. 이는 절편이 0과 유의하게 다르다는 것을 의미한다. 즉, sire의 수준이 1일 때 weight의 평균이 0이 아니라는 것을 나타낸다. sire2, sire3, sire4, sire5는 sire의 수준이 2, 3, 4, 5일 때 절편에 대한 차이를 나타낸다. sire2의 추정값은 13.875이고 표준오차는 10.072이다. t-검정 통계량은 1.378이고 p-값은 0.1760이다. 이는 sire2가 0과 유의하게 다르지 않다는 것을 의미한다. 즉, sire의 수준이 2일 때 weight의 평균이 sire의 수준이 1일 때와 유의하게 다르지 않다는 것을 나타낸다. sire3, sire4, sire5에 대해서도 같은 방식으로 해석할 수 있다. sire3의 경우에는 p-값이 0.0485로 유의수준 0.05보다 작으므로 sire3가 0과 유의하게 다르다고 볼 수 있다. 즉, sire의 수준이 3일 때 weight의 평균이 sire의 수준이 1일 때보다 유의하게 낮다는 것을 나타낸다.​Correlation of Fixed Effects는 https://i-model-h0use.com 고정효과의 상관계수를 보여준다. 이 값이 1이나 -1에 가까우면 다중공선성이 발생했다고 볼 수 있다. 이 모델에서는 sire2, sire3, sire4, sire5가 절편과 -0.707의 상관계수를 가지고 있으므로 다중공선성이 존재할 가능성이 있다. 또한, sire2, sire3, sire4, sire5는 서로 0.5의 상관계수를 가지고 있으므로 이들 간에도 다중공선성이 존재할 가능성이 있다.​optimizer (nloptwrap) convergence code는 최적화 알고리즘의 수렴 여부를 나타낸다. 이 값이 0이면 수렴했다는 것을 의미한다. boundary (singular) fit는 모델의 특이성을 나타낸다. 이는 무작위효과의 분산이 0이 되어서 고정효과와 중복되는 경우에 발생한다. 이 경우에는 모델의 추정이 불안정하고 신뢰할 수 없다. 따라서, 모델을 수정하거나 다른 모델을 사용하는 것이 좋다.​​​​​​​​​​​​​​​Reference​[1] Chapter 8 Linear Mixed Models | A Guide on Data Analysis (bookdown.org)8.1 Dependent Data Forms of dependent data: Multivariate measurements on different individuals: (e.g., a person’s blood pressure, fat, etc are correlated) Clustered measurements: (e.g., blood...bookdown.org[2] Interpret the key results for Fit Mixed Effects Model - MinitabInterpret the key results for Fit Mixed Effects Model Learn more about Minitab Statistical Software Complete the following steps to interpret a mixed effects model. In This Topic Step 1: Determine whether the random terms significantly affect the response Step 2: Determine whether the fixed effect...다층모형, 혼합모형 ICC계산함수Technical advance Open access Published: 06 January 2020 LEVEL (Logical Explanations &ampVisualizations of Estimates in Linear mixed models): recommendations for reporting multilevel data and analyses Maria Jose Monsalves 1 , Ananta Shrikant Bangdiwala 2 , Alex Thabane 3 &ampShrikant https://i-model-h0use.com Ishver Bangdiwala 3...Reporting random effects in mixed models - what is the correct choice?I have a question regarding the relevance of reporting (various) estimates of random effects in mixed models. Having read multiple papers and forum threads on the issue, I don't feel any closer to[6] How to write a report on a fitted mixed-effect model in a manuscript or in a thesis correctly? - StatsImprove​How to write a report on a fitted mixed-effect model in a manuscript or in a thesis correctly?Ronald Fisher was a genius, for someone the greatest after Darwin. It would be enough to go to his Wikipedia page to understand what a great work he has done. And thanks to this we all can use mixed-effect models now. Using mixed-effect models (or mixed models, or multilevel, as you prefer) is a com...​

댓글목록

등록된 댓글이 없습니다.

단체명 한국장애인미래협회 | 주소 대구광역시 수성구 동대구로 45 (두산동) 삼우빌딩 3층 | 사업자 등록번호 220-82-06318
대표 중앙회장 남경우 | 전화 053-716-6968 | 팩스 053-710-6968 | 이메일 kafdp19@gmail.com | 개인정보보호책임자 남경우