두 모집단에 대한 추론
1. 모평균 차이에 대한 추론(모분산을 아는 경우)
1) 모평균 차이의 추정
모분산을 아는 경우, 두 정규 모집단의 모평균 차이 에 대한 신뢰구간은 다음과 같다.
2) 모평균 차이의 검정
귀무가설
검정통계량
- 기각역:
- 기각역:
- 기각역:
2. 모평균 차이에 대한 추론(모분산을 모르지만 같은 경우)
1) 모평균 차이의 추정
모분산을 모르지만 같다고 볼 수 있느 ㄴ경우, 두 정규 모집단의 모평균 차이 에 대한 신뢰구간은 다음과 같다.
단,
2) 모평균 차이의 검정
귀무가설
검정통계량
단,
- 기각역:
- 기각역:
- 기각역:
3. 모평균 차이에 대한 추론(모분산을 모르며 다른 경우)
1) 모평균 차이의 추정
두 모분산이 같다는 가정을 할 수 없을 때는 정확한 표본 분포를 유도할 수 없지만, 통계학자 Satterthwaite가 다음과 같은 근사적 방법을 제안하였다,
여기서 자유도 는 Satterthwaite 자유도라고 하며, 다음과 같이 계산한다.
이에 따라 의 신뢰구간은 다음과 같이 구할 수 있다.
2) 모평균 차이의 검정
귀무가설
검정통계량
- 기각역:
- 기각역:
- 기각역:
* 표본의 개수가 매우 큰 경우
표본의 개수 과 가 매우 큰 경우에는 두 모분산을 모르더라도 대수의 법칙에 의해 이므로 근사적으로 다음과 같은 검정통계량을 사용할 수 있다.
- 기각역:
- 기각역:
- 기각역:
4. 모평균 차이에 대한 추론(모집단이 대응되는 경우)
두 모집단이 독립이 아닌 상황도 많이 존재한다. 특히, 동일한 대상에 대해 어떤 조치를 행한 후, 조치 전의 모집단과 조치 후의 모집단을 비교하는 경우 대응되는 모집단이 되며, 이렇게 얻은 표본을 쌍체표본(paired sample)이라 한다. 쌍체표본은 한 표본에서 두 개의 측정값을 구하여 비교하는 경우에 발생하며, 표본마다 나타나는 조치의 차이에 대하여 살펴보는 것이다. 예를 들어, 혈압 약의 효과를 알아보기 위하여 복용 전후의 혈압 차이를 추정하거나, 식이요법 전후의 몸무게 차이를 추정하는 경우가 해당한다.
1) 모평균 차이의 추정
이때 개의 표본에 대하여 조치 전후의 차이를 나타내는 확률표본을 라 하면 모집단은 두 개이지만 표본은 단일표본이 된다. 이 확률표본이 평균이 , 분산이 인 정규분포를 따른다고 가정하면, 다음과 같이 표본화한 통계량 는 자유도 인 t-분포를 따르게 된다.
두 정규 모집단의 모평균 차이 에 대한 신뢰구간은 다음과 같다.
2) 모평균 차이의 검정
귀무가설
검정통계량
- 기각역:
- 기각역:
- 기각역:
5. 모비율 차이에 대한 추론(표본이 큰 경우)
1) 모비율 차이의 추정
두 모집단 모비율을 각각 라 하고 각 모집단에서 충분히 큰 수의 표본 개를 추출하여 각각 개, 개의 성공횟수를 얻었다고 하자. 성공횟수 와 는 각각 와 같이 이항분포를 따르므로, 이며 따라서 는 각각 에 대한 불편추정량이 된다.
모비율의 차이에 대한 추정량 에 대한 기댓값은 , 분산은 이므로, 중심극한정리와 정규분포의 가법성에 의해 다음이 성립한다.
표본 크기 가 클 때, 두 모집단의 모비율 차이 에 대한 근사 신뢰구간은 다음과 같다.
2) 모비율 차이의 검정
귀무가설
표본의 크기가 충분히 크면 위와 같은 근사적인 분포를 얻고 귀무가설이 참이 경우 이가 되므로 다음과 같은 검정 통계량이 나온다.
그러나 대개의 경우 합동표본비율 을 사용하여 검정통계량을 정의한다.
- 기각역:
- 기각역:
- 기각역:
6. 모분산 비율에 대한 추론
* 두 정규모집단 표본분산비의 분포
두 정규모집단의 분산을 비교하고자 할 때, 크기의 차이를 비교하기보다는 비율을 비교하는 것이 바람직하다. F-분포는 이러한 목적으로 사용되는 통계량의 분포이다. 분산이 각각 인 두 개의 독립적인 정규모집단으로부터 추출한 크기 인 확률표본의 표본분산을 각각 라 하면, 다음의 정리를 얻을 수 있다.
1) 모분산 비율의 추정
두 모집단이 정규분포를 따르고, 모분산을 각각 라 하고 표본분산을 각각 라 하자. 누적확률 에 대응되는 자유도 인 F-분포의 분위수를 라 하면, 이므로 가 된다. 위의 표본분산비의 분포로부터 는 분포를 따르므로 아래의 식이 성립한다.
따라서 두 정규 모집단의 모분산 비율 에 대한 신뢰구간은 다음과 같다.
2) 모분산 비율의 검정
는 분포를 따르는데, 귀무가설 이 참이면 이므로 검정통계량은 다으모가 같다.
- 기각역:
- 기각역:
- 기각역: 혹은