Gae Ko's Blog

[SAS] 다중선형회귀모형 유의성 검정 (2) 본문

통계/SAS

[SAS] 다중선형회귀모형 유의성 검정 (2)

Gae Ko 2018. 3. 18. 04:05

적합시킬 모형 : y = β0 + β₁x₁ + β₂x₂ + β₃x₃ + ε

> correlation 결과 (with y)

x1 : 0.44892 약간 퍼져있다.
x2 : 0.84797 상관계수 높다.
x3 : 0.08978 오... 전혀 상관성이 없어 보인다. 

피어슨 상관 계수, N = 12
H0: Rho=0 가정하에서 Prob > |r|
  x1 x2 x3 y
x1
1.00000
 
0.00000
1.0000
0.00000
1.0000
0.44892
0.1432
x2
0.00000
1.0000
1.00000
 
0.00000
1.0000
0.84797
0.0005
x3
0.00000
1.0000
0.00000
1.0000
1.00000
 
0.08978
0.7814
y
0.44892
0.1432
0.84797
0.0005
0.08978
0.7814
1.00000



> Regression analysis 결과 


1) y = β0 + β₁x₁ + β₂x₂ + β₃x₃ + ε 모형


Analysis of Variance
Source DF Sum of
Squares
Mean
Square
F Value Pr > F
Model 3 1166.37500 388.79167 34.70 <.0001
Error 8 89.62500 11.20313    
Corrected Total 11 1256.00000      


Root MSE 3.34711 R-Square 0.9286
Dependent Mean 51.00000 Adj R-Sq 0.9019
Coeff Var 6.56295    


Parameter Estimates
Variable DF Parameter
Estimate
Standard
Error
t Value Pr > |t|
Intercept 1 51.00000 0.96623 52.78 <.0001
x1 1 5.62500 1.18338 4.75 0.0014
x2 1 10.62500 1.18338 8.98 <.0001
x3 1 1.12500 1.18338 0.95 0.3696


모형의 유의성은 유의수준 0.05에서 유의하다는 결과가 나왔지만 개별 회귀계수 유의성 검정에서는 β₁, β₂는 유의수준 0.05에서 매우 유의한 반면에 β₃는 그다지 유의하지 않다는 결과가 나왔다.



굳이 도움 안되는 변수 x3을 넣을 필요가 있을까?? 


x3을 뺴고 난 회귀모형으로 적합시켜보았다. 이를 회귀분석한 결과는 다음과 같다.


2) y = β0 + β₁x₁ + β₂x₂ + ε 모형


Analysis of Variance
Source DF Sum of
Squares
Mean
Square
F Value Pr > F
Model 2 1156.25000 578.12500 52.16 <.0001
Error 9 99.75000 11.08333    
Corrected Total 11 1256.00000      


Root MSE 3.32916 R-Square 0.9206
Dependent Mean 51.00000 Adj R-Sq 0.9029
Coeff Var 6.52777    


Parameter Estimates
Variable DF Parameter
Estimate
Standard
Error
t Value Pr > |t|
Intercept 1 51.00000 0.96105 53.07 <.0001
x1 1 5.62500 1.17704 4.78 0.0010
x2 1 10.62500 1.17704 9.03 <.0001


위와 비교해보니 여전히 모형의 유의성은 유의수준 0.05에서 유의하며 R-square값은 조오금 늘어남. (== MSE 값은 조오금 줄어듬)

차이는 그리 크지는 않지만 이 모형이 좀더 나을 수 있다. 

즉, 더 낫다고는 하지 못하지만 차이가 크지 않는 것을 보아 x3은 y에 별로 영향을 끼치지 못하는 거 같다는 판단을 내린다.