[R] 시계열 분석
#01. 시계열 분석 개요 1) 시계열 자료 시계열 자료 개요 시간의 흐름에 따라 관찰된 값들 시계열 데이터의 분석을통해 미래의 값을 예측하고 경향, 주기, 계절성 등을 파악하여 활용한다. 시계열 자료의 종류 비정상성 시계열 자료 - 시계열 분석을 실시할 때 다루기 어려운 자료로 대부분의 시계열자료. 정상성 시계열 자료- ...
#01. 시계열 분석 개요 1) 시계열 자료 시계열 자료 개요 시간의 흐름에 따라 관찰된 값들 시계열 데이터의 분석을통해 미래의 값을 예측하고 경향, 주기, 계절성 등을 파악하여 활용한다. 시계열 자료의 종류 비정상성 시계열 자료 - 시계열 분석을 실시할 때 다루기 어려운 자료로 대부분의 시계열자료. 정상성 시계열 자료- ...
회귀분석의 사전적 의미는 ‘go back to an earlier and worse condition’(옛날의 대표적인 상태로 돌아감)입니다. 대표적인 상태를 토대로 미래의 어떤 결과를 예측하는 분석을 회귀분석이라고 합니다. #01. 회귀분석(Regression analysis)의 이해 1) 회귀분석의 의미 하나나 그 이상의 독립변수들이 종...
상관분석은 두 변수가 서로 관련이 있는지 검정하는 통계 분석 기법입니다.
t-테스트(t-test, 또는 ‘t-검증’)은 모집단의 분산이나 표준편차를 알지 못할 때, 표본으로부터 추정된 분산이나 표준편차를 이용하여 두 모집단의 평균에 통계적으로 유의한 차이가 있는지 알아볼 때 사용하는 통계 분석 기법 입니다. R에는 t검정을 위한 함수가 내장되어 있기 때문에 특별한 패키지 설치 없이 수행할 수 있습니다. #01. One-...
추론통계를 진행하면서 확률과 확률분포가 직접적으로 사용되지는 않지만 많은 통계 과정의 기본 이론이 됩니다. 그러므로 확률과 확률 분포를 이해하는 것은 추론통계의 첫 걸음이라 할 수 있겠습니다. #01. 확률 특정 사건이 일어날 가능성의 척도 모든 사건의 확률값은 0과 1사이 표본공간 S에 부분집합인 각 사상에 대해 실수값을 가지는 함수...
추론통계란 모집단으로부터 추출된 표본의 표본통계량으로 부터 모집단의 특성인 모수에 관해 통계적으로 추론하는 절차로서 실질적인 데이터 분석과정이라 할 수 있습니다. #01. 데이터 분석의 구분 탐색적 데이터 분석(EDA) 확증적 데이터 분석(CDA) 활동 ...
이상치는 정상 범주에서 크게 벗어난 값을 말합니다. 데이터 수집 과정에서 오류가 발생할 수 있기 때문에, 현장에서 만들어진 실제 데이터에는 이상치가 포함될 수 있다. 이상치가 포함되어 있으면 분석 결과가 왜곡되기 때문에 분석에 앞서 이상치를 제거하는 작업을 해야 합니다. #01. 이상치의 이해 1) 이상치란? 의도하지 않게 잘못 입력한 경우...
데이터 정제란 데이터 분석에 앞서 전처리가 완료된 데이터에 대해 빈값(결측치)이나 정상 범위를 벗어난 값(이상치)들을 제거하거나 다른 값으로 대체하는 처리를 말합니다. #01.결측치 비어있는 값 (DB에서의 NULL과 비슷한 의미) 현장에서 만들어진 실제 데이터는 수집 과정에서 발생한 오류로 인해 결측치를 포함하고 있는 경우가 많다. ...
변수를 몇 개의 구간으로 나누어 각 구간별로 몇 개의 데이터가 분포되어 있는지를 확인하는 것은 전체 데이터의 분포를 확인하기 위해 중요한 작업 입니다. 이러한 데이터의 분포를 도수분포라고 합니다. #01. 도수분포 이해 1) 데이터의 구분 범주형자료(categorical/qualitative) 질적자료로서 명목척도, 서열척도가 이에 해당한다...
기술통계란 자료를 그래프나 숫자등으로 요약하는 통계적 행위 및 관련 방법을 의미합니다. 기술통계를 통해 데이터의 분석에 앞서 전체적으로 데이터의 특징을 파악하고 데이터를 다양한 각도로 접근할 수 있습니다. 기술통계는 데이터를 요약하고 시각화해서 잘 설명하는 것이 중점을 두며 데이터에 대해서 쉽게 설명하기 위해서 시각화를 많이 활용합니다. #01. 기...