[R] 데이터프레임(DataFrame)
데이터프레임(DataFrame)은 행과 열로 구성된 사각형의 표 형식의 자료구조로서 데이터 분석에서 가장 유용하며 필수불가결한 자료형입니다. 데이터프레임이라는 용어가 낯설다면 엑셀과 같은 분석 프로그램의 시트(sheet) 데이터를 구현하기 위한 자료형이라고 생각하면 이해하기 쉽습니다. #01. 데이터 프레임의 이해 1) 데이터 프레임 기본 구조 ...
데이터프레임(DataFrame)은 행과 열로 구성된 사각형의 표 형식의 자료구조로서 데이터 분석에서 가장 유용하며 필수불가결한 자료형입니다. 데이터프레임이라는 용어가 낯설다면 엑셀과 같은 분석 프로그램의 시트(sheet) 데이터를 구현하기 위한 자료형이라고 생각하면 이해하기 쉽습니다. #01. 데이터 프레임의 이해 1) 데이터 프레임 기본 구조 ...
리스트는 서로 다른 종류의 값들을 key(이름)와 value(값)의 쌍으로 저장하는 자료구조 입니다. 이런 형식의 자료구조를 다른 프로그래밍 언어에서는 Map 혹은 Dictionary 라고 부릅니다. 비슷한 개념의 용어를 함께 기억해 놓는 것이 좋겠습니다. #01. 리스트 만들기 리스트는 list()함수에 key=value 형식의 파라미터들을 나열...
요인(factor)은 범주형 데이터를 위한 데이터 타입으로 주어진 범위 내에서만 값을 할당할 수 있습니다. #01. 요인(factor) 만들기 factor는 값 혹은 값에 대한 범주를 의미하는 벡터이다. 1) 순서 없는 범주 성별 표현하기 factor가 포함할 수 있는 값은 범주 벡터에 나열된 값 중 하나만 가능함. gender &l...
R에서 다룰 수 있는 연속성 자료형으로서 행렬 구조가 있습니다. 행렬은 백터에 행과 열의 수를 지정하여 나누어 표현한 형태 입니다. #01. 행렬 생성하기 1) 행렬 만들기 백터를 matrix()함수에 전달하여 행렬로 변환함. 이 때 전달되는 두 번째 파라미터가 행의 수를 결정하며 열의 수는 자동으로 계산되어 지고 값은 왼쪽 열부터 차례...
여러 개의 스칼라 값들을 연속적으로 저장하는 데이터 형식으로 연속성 자료형이라고도 부릅니다. R에서의 연속성 자료형에는 벡터, 요인, 리스트 등이 있습니다. #01. 벡터의 이해 1) 기본적인 벡터 생성 벡터는 한 줄로 구성된 사물함 같은 형태로 스칼라 값의 모음. c() 함수를 사용하여 포함하고자 하는 같은 종류의 스칼라 값들을 콤마로...
앞으로 다양한 형식의 결과를 출력하려면 문장의 형식을 구성하는 것에 익숙해 져야 합니다. R에는 미리 준비된 치환자를 포함한 문자열에 스칼라값을 치환하여 결과를 만드는 방법으로 sprintf()함수를 제공하는데 이 때 사용되는 치환자를 형식문자라고 합니다. #01. 정수형태의 형식문자 %d 1) 형식문자 사용하기 sprintf() 함수를 사...
변수란 R에서 취급하는 데이터를 표현하는 단위 입니다. 이 데이터를 활용하여 각종 연산을 수행할 수 있는데 이 때 사용되는 특수기호들을 연산자라고 합니다. #01. R에서 사용되는 데이터의 종류 변수: 변할 수 있는 수 (일반적인 프로그래밍에서 사용되는 개념) 스칼라: R에서 프로그래밍의 변수를 부르는 용어 1) 스칼라 ...
R은 통계 계산과 그래픽을 위한 프로그래밍 언어이자 소프트웨어 환경입니다. R는 통계 소프트웨어 개발과 자료 분석에 널리 사용되고 있으며, 패키지 개발이 용이해 통계 소프트웨어 개발에 많이 쓰이고 있는 오픈소스 입니다.출처: 위키백과 #01. R 소개 구분 R 파이썬 ...
변수의 종류를 알아보고, 질적 데이터를 요약하는 막대그래프에 대하여 알아봅니다. 양적 데이터를 그래프를 요약하는 방법 중 히스토그램과 점도표에 대하여 살펴봅니다. 양적 데이터를 수치로 요약하는 방법 중 평균, 분산, 표준편차, 최빈값, 변이계수에 대하여 알아보고 이들의 특징을 살펴봅니다. 마지막으로 R에서 ggplot2 패키지를 설치하여 막대그래프를 ...
R을 활용하여 데이터 분석을 진행하기 위해서는 데이터 분석에 필요한 기본 개념들에 대한 숙지가 필요합니다. 이 포스팅에서는 데이터 분석 전에 숙지해야 할 기본 용어들과 개념을 소개합니다. #01. 데이터 수집(측정) 1) 측정이란? 표본조사나 실험을 하는 과정에서 추출된 원소나 관측자료를 얻는 것 관측자료 = 데이터 2) 변수(...