t-테스트(t-test, 또는 ‘t-검증’)은 모집단의 분산이나 표준편차를 알지 못할 때, 표본으로부터 추정된 분산이나 표준편차를 이용하여 두 모집단의 평균에 통계적으로 유의한 차이가 있는지 알아볼 때 사용하는 통계 분석 기법 입니다.
추론통계를 진행하면서 확률과 확률분포가 직접적으로 사용되지는 않지만 많은 통계 과정의 기본 이론이 됩니다. 그러므로 확률과 확률 분포를 이해하는 것은 추론통계의 첫 걸음이라 할 수 있겠습니다.
추론통계란 모집단으로부터 추출된 표본의 표본통계량으로 부터 모집단의 특성인 모수에 관해 통계적으로 추론하는 절차로서 실질적인 데이터 분석과정이라 할 수 있습니다.
이상치는 정상 범주에서 크게 벗어난 값을 말합니다. 데이터 수집 과정에서 오류가 발생할 수 있기 때문에, 현장에서 만들어진 실제 데이터에는 이상치가 포함될 수 있다. 이상치가 포함되어 있으면 분석 결과가 왜곡되기 때문에 분석에 앞서 이상치를 제거하는 작업을 해야 합니다.
데이터 정제란 데이터 분석에 앞서 전처리가 완료된 데이터에 대해 빈값(결측치)이나 정상 범위를 벗어난 값(이상치)들을 제거하거나 다른 값으로 대체하는 처리를 말합니다.