메인 콘텐츠로 이동하기
  1. 블로그 글/

통계 - 대응표본 T 검정(Paired t-Test)

본 글은 통계학에서 사용되는 대응표본 T 검정을 설명하기 위해 작성되었습니다.

금번에도 파이썬 라이브러리 Scipy를 활용하여 대응표본 T 검정을 진행하도록 하겠습니다.

대응표본 T 검정 #

대응표본 T 검정이란 두 관련된 집단 간의 평균을 비교하는 통계적 기법입니다. 이 방법은 일반적으로 동일한 피험자 집단에 대해 두 가지 측정값이 있는 경우에 적용됩니다. 대응표본 t-검정은 두 관련된 집단 간의 평균 차이가 통계적으로 유의한지 여부를 판단하는 데 사용됩니다.

1. 가설 설정 #

H₀ : 𝜇D  = 0 → 귀무가설  (𝜇𝐷 = 𝜇₁ - 𝜇₂) 실험 전과 후의 평균의 차이는 0이다.
H₁ : 𝜇D  ≠ 0 → 대립가설 실험 전과 후의 평균의 차이는 0이 아니다.

2. 정규성 검정 #

두 그룹의 표본 수가 30개 이하일 경우, 정규성 검정을 실시해야 합니다.

두 그룹의 표본 수가 30개 이상일 경우, 중심극한정리에 의해 정규성을 만족했다고 가정합니다.

  • Scipy에서 정규성 검정은 Shapiro-Wilk 검정을 통해서 확인 가능합니다.

4. 대응표본 T 통계량 계산 #

두 그룹의 평균과 표준편차를 사용하여 대응표본 T 통계량을 계산합니다.

5. 결정/결론 #

계산된 T 통계량이 임계값을 초과하면 귀무가설을 기각하고 대립가설을 채택합니다.

그렇지 않으면 귀무가설을 기각하지 않습니다.

통계적으로 유의한 차이가 있다면, 두 그룹 간에 평균 차이가 존재한다고 결론 내립니다.

파이썬 라이브러리 Scipy 활용 방법 #

다음은 파이썬 Scipy 라이브러리를 활용하여 대응표본 T 검정을 진행하도록 하겠습니다. 책 누구나 파이썬 통계분석의 챕터 11의 데이터 파일 ch11_training_ind.csv을 사용하였습니다.

책은 아래 링크를 통해 구입 가능합니다.

https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=237744461&start=slayer

이번에 다루는 데이터에는 A의 학급에서는 근력운동을 하면 집중력이 향상된다는 이야기가 돌아 A가 실제로 근력운동을 시작하기 전과 후를 비교하기로 하였습니다. A는 20명에게 근력운동을 하게 한 후, 운동 전과 후에 집중력 측정 테스트를 받게 한 결과입니다.

근력운동 전과 후 집중력에 유의한 차이가 있는지 대응표본 T 검정을 통해 알아보고자 합니다.

가설은 아래와 같습니다.

귀무가설 : 근력운동 전과 후의 테스트 평균은 같다.

대립가설 : 근력운동 전과 후의 테스트 평균은 같지 않다.

유의수준은 0.05로 설정하도록 하겠습니다.

우선 데이터를 불러오도록 하겠습니다.데이터 파일은 하기 링크를 통해 다운로드 가능합니다.

https://www.hanbit.co.kr/support/supplement_list.html

>>> import pandas as pd
>>> from scipy import stats
>>> df = pd.read_csv("./data/ch11_training_rel.csv")
>>> df.head()
0 59 41
1 52 63
2 55 68
3 61 59
4 59 84

다음은 정규성 검정을 하도록 하겠습니다.

>>> a = stats.shapiro(df['전'])
>>> b = stats.shapiro(df['후'])
>>> print(a, b)
ShapiroResult(statistic=0.9670045375823975, pvalue=0.690794825553894) 
ShapiroResult(statistic=0.9786625504493713, pvalue=0.9156817197799683)

결과는 모두 p-value가 0.05보다 커서 정규성을 만족합니다.

다음으로는, Scipy 라이브러리 내에 있는 ttest_rel를 통해 t통계량과 p-value를 구할 수 있습니다.

>> t_score, p_value = stats.ttest_rel(df['전'], df['후'])
>>> print(round(t_score, 4), round(p_value, 2))
-2.2042 0.04

p-value가 유의수준인 0.05보다 작기 때문에 귀무가설(근력운동 전과 후의 평균이 같다)이 기각되었습니다. 따라서 근력운동 전과 후의 평균 점수에 유의한 차이가 있다고 말할수 있다는 결론을 내릴 수 있습니다.