[R] 기술통계
기술통계란 자료를 그래프나 숫자등으로 요약하는 통계적 행위 및 관련 방법을 의미합니다. 기술통계를 통해 데이터의 분석에 앞서 전체적으로 데이터의 특징을 파악하고 데이터를 다양한 각도로 접근할 수 있습니다. 기술통계는 데이터를 요약하고 시각화해서 잘 설명하는 것이 중점을 두며 데이터에 대해서 쉽게 설명하기 위해서 시각화를 많이 활용합니다. #01. 기...
기술통계란 자료를 그래프나 숫자등으로 요약하는 통계적 행위 및 관련 방법을 의미합니다. 기술통계를 통해 데이터의 분석에 앞서 전체적으로 데이터의 특징을 파악하고 데이터를 다양한 각도로 접근할 수 있습니다. 기술통계는 데이터를 요약하고 시각화해서 잘 설명하는 것이 중점을 두며 데이터에 대해서 쉽게 설명하기 위해서 시각화를 많이 활용합니다. #01. 기...
R의 데이터프레임은 SQL 구문을 통해 데이터를 조회하는 기능을 제공합니다. 이를 통해 데이터를 원하는 형태로 변경하거나 요약할 수 있습니다.
데이터 마트(Data Mart, DM)는 데이터 웨어 하우스(Data Warehouse, DW)와 사용자 사이의 중간층으로서 하나의 주제 또는 하나의 부서 중심의 DataFrame입니다. 대부분 DW로부터 복제되지만 분석가가 자체적으로 수집할 수 도 있습니다. 대부분 관계형 데이터베이스나 다차원 데이터베이스를 이용하고 구축합니다. 고객과 관련된 데이...
데이터 전처리란 데이터를 본격적으로 분석하기 전에 분석에 적합하게 데이터를 가공하는 작업을 의미하는 것으로 데이터 가공(Data Manipulation), 데이터 핸들링(Data Handling)도 비슷한 의미로 사용되는 용어들 입니다. 데이터 전처리에서 수행되는 주요 작업들에는 아래와 같은 것들이 있습니다. 행,열의 순서, 이름 변경 데...
이 자료는 예전 수업자료로 배포하던 pdf 파일입니다. pdf 파일을 페이지 안에 포함시켜 놓았습니다.
이 자료는 예전 수업자료로 배포하던 pdf 파일입니다. pdf 파일을 페이지 안에 포함시켜 놓았습니다.
이 자료는 예전 수업자료로 배포하던 pdf 파일입니다. pdf 파일을 페이지 안에 포함시켜 놓았습니다.
이 자료는 예전 수업자료로 배포하던 pdf 파일입니다. pdf 파일을 페이지 안에 포함시켜 놓았습니다.
이 자료는 예전 수업자료로 배포하던 pdf 파일입니다. pdf 파일을 페이지 안에 포함시켜 놓았습니다.
R에서는 데이터를 표현하기 위해 DataFrame이라는 자료형을 제공합니다. DataFrame을 이해하고 잘 다루는 것은 데이터 처리에 있어서 가장 기본이 되는 작업입니다. #01. 패키지 로드 및 샘플 데이터프래임 구성 패키지 로드하기 REPO_URL <- "https://cran.seoul.go.kr/" if (!require(readx...