일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- select()
- summarize()
- samp;e_frac()
- filter()
- 대칭형 알고리즘
- dplyr
- sample_n()
- mutate()
- proc contents
- distinct()
- groupe_by()
- arrange()
- AES
- Today
- Total
목록통계 (34)
Gae Ko's Blog
SAShttp://www.mysas.co.kr/SAS_tiptech/c_tiptech.asp?B_NO=2024&gotopage=9&cmd=content
1. 편차 (Deviation)관측치가 평균으로 부터 떨어져 있는 정도, 즉 평균과 관측치와의 차이'표준편차(SD)'는 이러한 편차들의 평균값으로 평균으로부터 얼마나 떨어져 있는가에 대한 정보를 제공표준편차 (SD, Standard Deviation)- 관측값들이 집합내에서 평균과 어느정도 떨어져 있는지 알 수 있음- 모표준편차 : - 표본표준편차 : 2. 오차 (Error)예측하기위하여 추정된 값과 실제값의 차이, 즉 예측값이 정확하지 못한 정도모집단에 대해 모르는 경우 표본집단의 평균과 모집단의 평균에는 sampling error가 발생한다. 이때 모집단의 평균과 가까워지기 위해 여러번의 sampling을 통해 각 표본집단의 평균들로 이루어진 표본평균분포를 얻으면 이 분포의 표준편차가 '표준오차(SE..
MSE(mean square error)란?오차(잔차)의 제곱에 대한 평균을 취한 값으로 통계적 추정의 정확성에 대한 질적인 척도로 많이 사용됨- 실제값(관측값)과 추정값과의 차이. 즉 잔차가 얼마인가를 알려주는데 많이 사용되는 척도 (MSE가 작을수록 추정의 정확성이 높아짐)- 점추정에 있어 정확한 선택기준의 중요한 측도(measure)중 하나모수에 대한 좋은 추정량을 찾는데에 있어서 MSE가 가장 작은 것을 찾는게 목표인데, 모든 추정량을 놓고 그들의 MSE를 비교하자니 너무 많아서 추정량들 중에서 편의가 없는 추정량들만을 대상으로 비교하고자 한다. 즉, 불편추정량 중에서 분산이 작은 MSE인 추정량을 찾자.→ 이러한 추정량을 최소분산불편추정량(MVUE: minimum variance unbiased..
순차제곱합(type 1)은 이전에 포함된 항에 하나의 새로운 행이 추가된 모형에서의 제곱합으로, 이 값은 모형 차수에 따라 달라진다.(sas 또는 minitab에서 모형에 요인 또는 예측변수를 입력한 순서에 따라 달라짐)예를 들어 x1,x2,x3 요인 또는 예측 변수가 세 개인 모형의 경우, x1의 순차제곱합은 x1만 들어간 상태에서의 설명되는 분산의 정도가 나오고,x2는 이전에 포함된 항 즉, x1만 있던 상태에서 x2에 의해 설명되는 분산의 정도를 나타낸다. 그리고 x3은 x1과 x2가 있던 상태에서 x3이 추가되었을 경우에 x3이 설명되는 분산의 정도를 나타낸다. 수정제곱합(type 3)은 다른항 모두가 모형에 이미 포함되어있을 때 각 특정 항을 추가함으로써 결정되는 추가적인 제곱합으로 이 값은 모..
- SAS는 항상 고정모델에서 분석해준다. - ANOVA는 각 요인들이 직교하는 경우 즉 선형모델인 경우에 분산분석 시 사용된다. (직교하지 않는 경우엔 GLM 프로시저를 사용)The ANOVA procedure performs analysis of variance (ANOVA) for balanced data from a wide variety of experimental designs. In analysis of variance, a continuous response variable, known as a dependent variable, is measured under experimental conditions identified by classification variables, known as..
The VARCOMP procedure handles general linear models that have random effects. Random effects are classification effects with levels that are assumed to be randomly selected from an infinite population of possible levels. PROC VARCOMP estimates the contribution of each of the random effects to the variance of the dependent variable. (출처 : SAS도움말 https://support.sas.com/documentation/cdl/en/statug..
Method Variances DF t Value Pr > |t| Pooled Equal 674 -10.30
KEEP 과 DROP 옵션 keep 옵션은 특정변수만을 남기고 데이터셋 생성 drop 옵션은 해당 변수들을 제외한 데이터셋이 생성 예시) ==사진==
R 데이터프레임 결합 : rbind( ), cbind( ), merge( ) - 함수 비교 (1) 행 결합 (위 + 아래) : rbind( A, B) rbind는 row bind 의 약자 위의 행결합 rbind()를 하기 위해서는 결합하려는 두 개의 데이터셋의 열의 개수와 속성, 이름이 같아야만 함 만약 맞지 않으면 맞지 않다고 에러메세지가 뜸 ==사진== (2) 열 결합 (왽쪽 + 오른쪽) : cbind( A, B) cbind는 column bind의 약자 cbind()도 결합하려는 두 데이터셋의 관측치가 행이 서로 동일 대상이여야하고, 행의 개수도 서로 같아야만 함 마찬가지로 맞지 않으면 맞지 않다고 에러메세지가 뜸==사진== (3) 동일 key 값 기준 결합 : merge( A, B, by='key..
통계적 유의성은 모집단에 대한 가설이 가지는 통계적 의미를 말한다.다시 말해서, 어떤 실험 결과 자료를 두고 "통계적으로 유의하다."라고 하는 것은 확률적으로 봐서 단순한 우연이라고 생각되지 않을 정도로 의미가 있다는 뜻.반대로 "통계적으로 유의하지 않다."라고 하는 것은 실험결과가 단순한 우연일 수도 있다는 뜻 가설검정에서 통계값과 연구자가 설정한(유의수준)을 비교 및 판단하여 귀무가설을 기각할 때, 연구가설이 "통계적으로 유의하다"라고 한다. 다만, 검정통계량은 표본 크기의 함수이므로 표본 크기가 커질수록 검정통계량의 값은 커져서 실질적으로는 유의성이 없어도 통계적으로 유의한 것으로 판정될 수 있다. 이때의 오류는 1종 오류가 된다. 즉, 통계적 유의성은 오류가능성을 동반한다. (출처:위키백과)