카이제곱분포, t-분포, F-분포
카이제곱분포, t-분포, F-분포
카이제곱분포
표준정규분포를 따르는 확률표본을 제곱해서 합한 확률변수의 분포
표준정규모집단으로부터 추출된 확률표본을 이라 하면, 는 자유도가 인 카이제곱분포를 따른다.
#카이제곱분포의 확률밀도함수(df: 자유도, ncp: 비중심모수(사용하지 않음)) dchisq(x, df, ncp = 0) #카이제곱분포의 누적분포함수 F(x) pchisq(x, df, ncp = 0, lower.tail=T) #카이제곱분포의 분위수(p: 누적확률) qchisq(p, df, ncp = 0, lower.tail = T) #카이제곱분포의 확률변수(n: 난수의 개수) rchisq(n, df, ncp = 0)
자유도가 인 카이제곱분포를 따르는 확률변수 의 확률밀도함수는 다음과 같다.
감마분포의 확률밀도함수와 비교해보면, 카이제곱분포는 인 감마분포와 같음을 알 수 있다.
* 자유도(degree of freedom)
제곱합에 포함되는 ‘독립적인 항의 개수’를 의미
겉으로 보기에는 개 항의 제곱합이라도 독립적인 항의 개수가 개라면, 자유도는 가 된다.
t-분포
표준정규분포를 따르는 확률분포를 라 하고, 와는 독립적으로 자유도 인 카이제곱 분포를 따르는 확률변수를 라 하면, 확률변수 는 자유도 인 t-분포를 따른다.
#t-분포의 확률밀도함수 f(x) (df: 자유도, ncp: 비중심모수(사용하지않음)) dt(x, df, ncp) #t-분포의 누적분포함수 F(x) pt(x, df, ncp, lower.tail = T) #t-분포의 분위수(p: 누적확률) qt(p, df, ncp, lower.tail = T) #t-분포의 확률변수(n: 난수의 개수) rt(n, df, ncp)
F-분포
카이제곱분포를 따르며 독립적인 두 개의 확률변수를 각각의 자유도로 나누어 비율을 취하면 F-분포를 따른다. 즉, 자유도가 과 인 카이제곱분포를 따르며 독립적인 확률변수를 각각 와 라 하면,
#F-분포의 확률밀도함수(df, df2: 자유도, ncp: 비중심모수(사용하지 않음)) df(x, df1, df2, ncp) #F=분포의 누적분포함수 F(x) pf(x, df1, df2, ncp, lower.tail = T) #F-분포의 분위수 (p: 누적확률) qf(p, df1, df2, ncp, lower.tail = T) #F-분포의 확률변수 (n: 난수의 개수) rf(n, df1, df2, ncp)
F-분포는 분자의 자유도 과 분모의 자유도 를 갖는다. 분자와 분모를 바꾸면 자유도의 순서도 바뀌게 된다. F-분포의 분위수를 라 하면, 이는 누적확률이 가 되는 값을 의미한다. 분모와 분자를 바꾸면 대칭성에 의하여 꼬리확률이 누적확률이 되므로 다음 식이 성립한다.