일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- mutate()
- sample_n()
- arrange()
- distinct()
- summarize()
- select()
- 대칭형 알고리즘
- groupe_by()
- proc contents
- dplyr
- samp;e_frac()
- filter()
- AES
- Today
- Total
목록통계/SAS (13)
Gae Ko's Blog
적합시킬 모형 : y = β0 + β₁x₁ + β₂x₂ + β₃x₃ + ε > correlation 결과 (with y) x1 : 0.44892 약간 퍼져있다.x2 : 0.84797 상관계수 높다.x3 : 0.08978 오... 전혀 상관성이 없어 보인다. 피어슨 상관 계수, N = 12 H0: Rho=0 가정하에서 Prob > |r| x1 x2 x3 y x1 1.00000 0.00000 1.0000 0.00000 1.0000 0.44892 0.1432 x2 0.00000 1.0000 1.00000 0.00000 1.0000 0.84797 0.0005 x3 0.00000 1.0000 0.00000 1.0000 1.00000 0.08978 0.7814 y 0.44892 0.1432 0.84797 0.000..
예제(9.2)종합체의 점도(y)와 두 가지의 공정변수, 반응온도(x1)와 촉매공급률(x2)에 대한 16개의 관측값들이 있다. 점도는 이 두 변수와 선형 관계가 있다고 판단된다. 회귀의 유의성을 검증하라. 적합시킬 모형 : y = β0 + β₁x₁ + β₂x₂ + ε 일단 x1와 x2의 관측값을 각자 y와 plot하여 분포를 살펴보자. x1은 y와 뭔가 선형성이 보인다. x2는 y와 아무런 관련이 없는 거 같아 보인다. 상관계수를 구해보니 x1와의 상관계수는 0.95293으로 매우 높은 반면 x2와의 상관계수는 0.27167로 매우 낮다. 위에서 분포를 보고 추측한 결과와 매우 잘 맞는거 같다. 이제 y = β0 + β₁x₁ + β₂x₂ + ε 모형으로 회귀분석을 해보자. Analysis of Varian..
* 데이터 탐색(히스토그램, 상자그림)을 통해 자료분석을 하게 될 경우, 구분점을 발견하게 되면 구분점을 중심으로 나눠서 분석한다.이상한 집단으로 생각되는 값은 삭제하지 않고 별도로 추가분속을 실시한다. * 정규성 검토 시 일직선이다 아니다 만을 생각하지 말고 이상치 같은 아이들을 나눠서 분해하여 생각해보자→ 구분점을 발견하자→ 구분점을 기준으로 구간화하여 분석하자
두 집단의 분포 비교하기 (T검정)T-Test의 조건 : 정규성 & 등분산성 >> SAS code 1. 데이터 가져오기 PROC EXPORT 2. 데이터 셋 내의 전체 속성 보기PROC CONTENTS 변수들에 대해서 알 수 있는 프로시저 (결과 중 일부분) 여기서 예제 데이터는 지역(region)에 따른 사교육비(edu)에 대한 데이터 지역은 각 지역마다 숫자로 표시 (ex. 11번=서울, 39번=대전) // PROC CONTENTS 란?See concepts for the CONTENTS Statement. (SAS 도움말 : http://documentation.sas.com/?docsetId=proc&docsetVersion=9.4&docsetTarget=n0v6kjzws1u302n1u3pt7rp..
여러가지 파일들을 SAS로 불러와 핸들링하고 분석할 수 있는데, 가장 대표적으로 많이 사용하는 것들이 택스트파일과 엑셀파일이다.전체적인 틀은 다음과 같다.
SAShttp://www.mysas.co.kr/SAS_tiptech/c_tiptech.asp?B_NO=2024&gotopage=9&cmd=content
- SAS는 항상 고정모델에서 분석해준다. - ANOVA는 각 요인들이 직교하는 경우 즉 선형모델인 경우에 분산분석 시 사용된다. (직교하지 않는 경우엔 GLM 프로시저를 사용)The ANOVA procedure performs analysis of variance (ANOVA) for balanced data from a wide variety of experimental designs. In analysis of variance, a continuous response variable, known as a dependent variable, is measured under experimental conditions identified by classification variables, known as..
The VARCOMP procedure handles general linear models that have random effects. Random effects are classification effects with levels that are assumed to be randomly selected from an infinite population of possible levels. PROC VARCOMP estimates the contribution of each of the random effects to the variance of the dependent variable. (출처 : SAS도움말 https://support.sas.com/documentation/cdl/en/statug..
Method Variances DF t Value Pr > |t| Pooled Equal 674 -10.30