일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- mutate()
- dplyr
- summarize()
- sample_n()
- arrange()
- samp;e_frac()
- 대칭형 알고리즘
- groupe_by()
- distinct()
- select()
- proc contents
- AES
- filter()
- Today
- Total
Gae Ko's Blog
[통계] 회귀분석_R Squre 본문
통계학에서는 회귀분석(Regression Analysis)을 모형 혹은 모델이라고 부르는데 통계분석에서는 모든 모형은 모형 자체가 통계적으로 의미가 있는지 없는지를 검증하는 지표가 존재한다. 회귀분석(Regression Analysis)에서는 R Square값이 바로 회귀모델 자체에 대한 통계적 검증 지표인 것이다.
R Square는 R을 제곱한 수치리다. SPSS에서는 R Square와 Adjusted R Square를 동시에 보여주는데 Adjusted R Square는 회귀분석(Regression Analysis)의 분석 로직상 R Square를 실제보다 크게 만드는 단점이 있다는 점을 감안해 R Square를 보수적으로 조정한 수치이다. 분석에 사용된 표본크기가 200명 이상인 경우에는 Adjusted R Square를 기준으로 해석하는 것이 정확하다.
R Square는 변수(문항)간의 상관계수를 제곱한 것으로 학계에서는 0.6이상, 마케팅조사 실무에서는 0.3이상이면 의미가 있다(사용되도 된다)고 해석한다, 이 수치가 의미하는 것은 원인변수가 결과변수를 설명하는 정도로서 R Square가 0.4라는 것은 원인변수들의 분산이 결과변수의 분산을 40%정도 설명한다는 뜻이다. 언뜻 생각해보면 원인변수들의 설명력이 50%도 안되는데 의미가 있나라고 생각할 수도 있지만, 사회과학에서는 어떤 현상을 100% 설명하는 것은 현실적으로 불가능하고 절대 가능할 수도 없는 것임을 감안하다면 40%도 결코 적은 수치가 아니라고 할 수 있다. 회귀분석(Regression Analysis)을 실시했을 때 이 R Squarer값이 0.4이상이 되지 않으면 나머지 지표들은 볼 필요도 없이 의미가 없는 것이므로 반드시 이 지표를 먼저 봐서 0.4이상인지를 확인하여야 한다.
(출처: http://cafe.daum.net)
'통계 > 통계학에 대한 정보' 카테고리의 다른 글
[통계] 가설검정 (0) | 2017.12.20 |
---|---|
[통계] 편차 / 오차 / 잔차 (0) | 2017.11.23 |
[수리통계] MSE (평균제곱오차) (0) | 2017.11.23 |
[통계] 오차제곱합 type1 와 type3 (0) | 2017.11.22 |
[통계] 통계적 유의성이란? (0) | 2017.10.07 |