Gae Ko's Blog

[통계] 회귀분석_R Squre 본문

통계/통계학에 대한 정보

[통계] 회귀분석_R Squre

Gae Ko 2017. 10. 7. 02:31

통계학에서는 회귀분석(Regression Analysis)을 모형 혹은 모델이라고 부르는데 통계분석에서는 모든 모형은 모형 자체가 통계적으로 의미가 있는지 없는지를 검증하는 지표가 존재한다. 회귀분석(Regression Analysis)에서는 R Square값이 바로 회귀모델 자체에 대한 통계적 검증 지표인 것이다.



R Square는 R을 제곱한 수치리다. SPSS에서는 R Square와 Adjusted R Square를 동시에 보여주는데 Adjusted R Square는 회귀분석(Regression Analysis)의 분석 로직상 R Square를 실제보다 크게 만드는 단점이 있다는 점을 감안해 R Square를 보수적으로 조정한 수치이다. 분석에 사용된 표본크기가 200명 이상인 경우에는 Adjusted R Square를 기준으로 해석하는 것이 정확하다.


R Square는 변수(문항)간의 상관계수를 제곱한 것으로 학계에서는 0.6이상, 마케팅조사 실무에서는 0.3이상이면 의미가 있다(사용되도 된다)고 해석한다, 이 수치가 의미하는 것은 원인변수가 결과변수를 설명하는 정도로서 R Square가 0.4라는 것은 원인변수들의 분산이 결과변수의 분산을 40%정도 설명한다는 뜻이다. 언뜻 생각해보면 원인변수들의 설명력이 50%도 안되는데 의미가 있나라고 생각할 수도 있지만, 사회과학에서는 어떤 현상을 100% 설명하는 것은 현실적으로 불가능하고 절대 가능할 수도 없는 것임을 감안하다면 40%도 결코 적은 수치가 아니라고 할 수 있다. 회귀분석(Regression Analysis)을 실시했을 때 이 R Squarer값이 0.4이상이 되지 않으면 나머지 지표들은 볼 필요도 없이 의미가 없는 것이므로 반드시 이 지표를 먼저 봐서 0.4이상인지를 확인하여야 한다. 


(출처: http://cafe.daum.net)