by TheYoonicon 3월 24, 2018 0 comment

연속형 확률분포

Post Views: 1,310

연속형 확률분포¹

지수분포

확률밀도함수가 지수적으로 감소하는 확률분포

$f(x) = \lambda e^{-\lambda x}, ~ x>0$

#확률밀도함수 f(x) (rate: lambda, 초기치: rate=1)
dexp(x, rate)
#누적분포함수 F(x)
pexp(x, rate, lower.tail=T)
#분위수 (p: 누적확률)
qexp(p, rate, lower.tail=T)
#지수 확률변수(n: 난수의 개수)
rexp(n, rate)

* 지수분포의 비기억(memoryless) 특성

$P(X>x+y|X>y)=\frac{P(X>x+y)}{P(X>y)} = \frac{e^{-\lambda(x+y)}}{e^{-\lambda y}} = e^{-\lambda y}=P(X>x)$

이산형분포 중 비기억 특성을 갖는 분포는 기하분포이다.
어떤 제품의 수명이 지수분포를 따른다면, 비기억 특성에 의해 ‘이 제품이 $y$ 시간 작동했다는 조건 하에서 앞으로 $x$ 시간 더 작동할 확률’은 ‘새 제품이 $x$ 시간 작동할 확률’과 같다는 의미가 된다.

감마분포

$f(x) = \frac{1}{\theta^\alpha \Gamma(\alpha)} \times x^{\alpha -1} e^{-x/\theta},~ x>0; ~\alpha,\theta >0$

$\alpha$ : 분포의 형태를 결정하는 형상모수(shape parameter)
$\theta$ : 단위를 결정하는 척도모수(scale parameter)

* 감마함수(gamma function)

$\Gamma (\alpha) = \int_{0}^{\infty} y^{\alpha -1}e^{-y}dy$

감마함수를 부분적분하면

$\Gamma(\alpha)=(\alpha-1)\Gamma(\alpha -1), ~ \Gamma(1)=1$

이 되는데 만약 $\alpha$ 가 정수 $n$ 이라면

$\Gamma = (n-1)!$ 이 된다.

위의 확률밀도함수에서

$\int_0 ^{\infty} f(x)dx = 1$

이 되어야 하므로

$C = \frac{1}{\theta ^\alpha \Gamma(\alpha)}$

가 된다.

만약 $\alpha=1$ 이라면

$f(x) = \frac{1}{\theta} e^{-x/\theta}$ ,

즉 $\lambda = 1 /\theta$ 인 지수분포가 된다.

#확률밀도함수 f(x) (shape: alpha, rate: 1/theta와 scale: theta 중 하나만 입력)
dgamma(x, shape, (rate), scale)
#누적분포함수 F(x)
pgamma(x, shape, (rate), scale, lower.tail=T)
#분위수 (p: 누적확률)
qgamma(p, shape, (rate), scale, lower.tail=T)
#감마 확률변수 (n: 난수의 개수)
rgamma(n, shape, (rate), scale)

* 감마분포와 지수분포와의 관계

독립적으로 동일한 지수분포를 따르는 확률변수의 합은 감마분포를 따른다.

와이블분포(Weibull distribution)

와이블분포는 수명분포로서 가장 많이 사용된다.

$f(x) = (\frac{\alpha}{\theta})(\frac{x}{\theta})^{\alpha} exp\begin{bmatrix} -(\frac{x}{\theta})^{\alpha} \end{bmatrix}$

$\alpha$ : 형상모수, $\theta$ : 척도모수, $\alpha=1$ 이면 지수분포가 된다.

#확률밀도함수 f(x) (shape: alpha, scale: theta), 초기치 (scale=1)
dweibull(x, shape, scale.default)
#누적분포함수 F(x)
pweibull(x, shape, scale, lower.tail=T)
#분위수 (p: 누적확률)
qweibull(p, shape, scale, lower.tail=T)
#와이블 확률변수 (n: 난수의 개수)
rweibull(n, shape, scale)

* 누적분포함수 구하기

$y = (x/\theta) ^\alpha$ 으로 치환하면 $dy = (\alpha/\theta)(x/\theta)^{\alpha-1}dx$ 이므로 $f(x)dx = e^{-y}dy$ 가 되어

$F(t) =\int_0^t f(x)dx = \int_0 ^{(t/\theta)^\alpha}e^{-\lambda}dy = 1-exp\begin{bmatrix} -(\frac{t}{\theta})^\alpha \end{bmatrix}$ 가 된다.

확률변수 $X$ 를 수명(lifetime)인 경우로 한정하면, $P(X>x)$ 는 수명이 $x$ 보다 클 확률이므로, 이를 신뢰도(reliability) 함수 $R(x)$ 라 한다.

$R(x) = 1-F(x)$

고장률(failure rate) 함수는 $\lambda(x) = f(x)/R(x)$ 가 된다.

베타분포

베타분포는 두 개의 모수 $\dpi{100} \alpha$ 와 $\dpi{100} \beta$ 에 따라 $\dpi{100} [0, 1]$ 구간에서 다양한 분포형태를 갖는 분포로서, 베이지안 분석에서 어떤 사상의 발생확률 $\dpi{100} p$ 의 사전분포(prior)로 많이 사용된다.

$\dpi{100} f(x) = \frac{1}{B(\alpha, \beta)} x^{\alpha-1} (1-x)^{\beta-1}, ~ 0\leq x\leq 1; ~\alpha, \beta>0$

$\dpi{100} B(\alpha, \beta) = \int_0^1 x^{\alpha-1}(1-x)^{\beta-1}dx = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha+\beta)}$

#확률밀도함수 f(x) (shape1: alpha, shape2: beta, ncp: 비중심모두, 사용하지 않음)
dbeta(x, shape1, shape2, ncp=0)
#누적분포함수 F(x)
pbeta(x, shape1, shape2, ncp=0, lower.tail=T)
#분위수 (p: 누적확률)
qbeta(p, shape1, shape2, ncp=0, lower.tail=T)
#베타 확렬변수 (n: 난수의 개수)
rbeta(n, shape1, shape2, ncp=0)

임태진. R-확률통계. 생능출판; 2016.

연속형 확률분포