일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- sample_n()
- samp;e_frac()
- proc contents
- arrange()
- mutate()
- filter()
- groupe_by()
- summarize()
- dplyr
- select()
- distinct()
- AES
- 대칭형 알고리즘
Archives
- Today
- Total
Gae Ko's Blog
[SAS] 다중선형회귀모형 유의성 검정 (2) 본문
적합시킬 모형 : y = β0 + β₁x₁ + β₂x₂ + β₃x₃ + ε
> correlation 결과 (with y)
x1 : 0.44892 약간 퍼져있다.
x2 : 0.84797 상관계수 높다.
x3 : 0.08978 오... 전혀 상관성이 없어 보인다.
피어슨 상관 계수, N = 12 H0: Rho=0 가정하에서 Prob > |r| | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
x1 | x2 | x3 | y | |||||||||
x1 |
|
|
|
| ||||||||
x2 |
|
|
|
| ||||||||
x3 |
|
|
|
| ||||||||
y |
|
|
|
|
> Regression analysis 결과
1) y = β0 + β₁x₁ + β₂x₂ + β₃x₃ + ε 모형
Analysis of Variance | |||||
---|---|---|---|---|---|
Source | DF | Sum of Squares |
Mean Square |
F Value | Pr > F |
Model | 3 | 1166.37500 | 388.79167 | 34.70 | <.0001 |
Error | 8 | 89.62500 | 11.20313 | ||
Corrected Total | 11 | 1256.00000 |
Root MSE | 3.34711 | R-Square | 0.9286 |
---|---|---|---|
Dependent Mean | 51.00000 | Adj R-Sq | 0.9019 |
Coeff Var | 6.56295 |
Parameter Estimates | |||||
---|---|---|---|---|---|
Variable | DF | Parameter Estimate |
Standard Error |
t Value | Pr > |t| |
Intercept | 1 | 51.00000 | 0.96623 | 52.78 | <.0001 |
x1 | 1 | 5.62500 | 1.18338 | 4.75 | 0.0014 |
x2 | 1 | 10.62500 | 1.18338 | 8.98 | <.0001 |
x3 | 1 | 1.12500 | 1.18338 | 0.95 | 0.3696 |
모형의 유의성은 유의수준 0.05에서 유의하다는 결과가 나왔지만 개별 회귀계수 유의성 검정에서는 β₁, β₂는 유의수준 0.05에서 매우 유의한 반면에 β₃는 그다지 유의하지 않다는 결과가 나왔다.
굳이 도움 안되는 변수 x3을 넣을 필요가 있을까??
x3을 뺴고 난 회귀모형으로 적합시켜보았다. 이를 회귀분석한 결과는 다음과 같다.
2) y = β0 + β₁x₁ + β₂x₂ + ε 모형
Analysis of Variance | |||||
---|---|---|---|---|---|
Source | DF | Sum of Squares |
Mean Square |
F Value | Pr > F |
Model | 2 | 1156.25000 | 578.12500 | 52.16 | <.0001 |
Error | 9 | 99.75000 | 11.08333 | ||
Corrected Total | 11 | 1256.00000 |
Root MSE | 3.32916 | R-Square | 0.9206 |
---|---|---|---|
Dependent Mean | 51.00000 | Adj R-Sq | 0.9029 |
Coeff Var | 6.52777 |
Parameter Estimates | |||||
---|---|---|---|---|---|
Variable | DF | Parameter Estimate |
Standard Error |
t Value | Pr > |t| |
Intercept | 1 | 51.00000 | 0.96105 | 53.07 | <.0001 |
x1 | 1 | 5.62500 | 1.17704 | 4.78 | 0.0010 |
x2 | 1 | 10.62500 | 1.17704 | 9.03 | <.0001 |
위와 비교해보니 여전히 모형의 유의성은 유의수준 0.05에서 유의하며 R-square값은 조오금 늘어남. (== MSE 값은 조오금 줄어듬)
차이는 그리 크지는 않지만 이 모형이 좀더 나을 수 있다.
즉, 더 낫다고는 하지 못하지만 차이가 크지 않는 것을 보아 x3은 y에 별로 영향을 끼치지 못하는 거 같다는 판단을 내린다.
'통계 > SAS ' 카테고리의 다른 글
[SAS] 다중선형회귀모형 유의성 검정 (0) | 2018.03.18 |
---|---|
[SAS] 구분점 (0) | 2017.12.17 |
[SAS] 두 집단의 분포 비교하기 (T검정) (0) | 2017.12.16 |
[SAS] PROC IMPORT& PROC EXPORT (데이터 가져오기&데이터 내보내기) (0) | 2017.12.16 |
[SAS] PROC GLM (0) | 2017.11.27 |