ggplot(data=교통사고,aes(x=발생건수,y=부상자수))+geom_point(size=3,colour='blue')+# 배경을 흰색으로 설정theme_bw()+# 그래프 타이틀 설정ggtitle("교통사고 발생건수와 부상자 수의 상관관계")+# x축 제목 설정 --> 표시안함을 위해 빈 문자열 설정xlab("발생건수")+# y축 제목 설정 --> 표시안함을 위해 빈 문자열 설정ylab("부상자수")+# 각 텍스트의 색상, 크기, 각도, 글꼴 설정theme(plot.title=element_text(family="NanumGothic",color="#0066ff",size=25,face="bold"),axis.title.x=element_text(family="NanumGothic",color="#999999",size=18,face="bold"),axis.title.y=element_text(family="NanumGothic",color="#999999",size=18,face="bold",hjust=1),axis.text.x=element_text(family="NanumGothic",color="#000000",size=16,angle=45),axis.text.y=element_text(family="NanumGothic",color="#000000",size=16,angle=45))
💻 출력결과
6) 교통사고 발생건수와 사망자수의 상관관계
앞에서 이미 필요한 패키지 로드, 기본 옵션등을 설정해 놓았으므로 그래프를 바로 구현한다.
교통사고 발생건수와 사망자수의 상관관계 산점도 그래프
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
ggplot(data=교통사고,aes(x=발생건수,y=사망자수))+geom_point(size=3,colour='#ff6600')+# 배경을 흰색으로 설정theme_bw()+# 그래프 타이틀 설정ggtitle("교통사고 발생건수와 사망자 수의 상관관계")+# x축 제목 설정 --> 표시안함을 위해 빈 문자열 설정xlab("발생건수")+# y축 제목 설정 --> 표시안함을 위해 빈 문자열 설정ylab("부상자수")+# 각 텍스트의 색상, 크기, 각도, 글꼴 설정theme(plot.title=element_text(family="NanumGothic",color="#ff0000",size=25,face="bold"),axis.title.x=element_text(family="NanumGothic",color="#999999",size=18,face="bold"),axis.title.y=element_text(family="NanumGothic",color="#999999",size=18,face="bold",hjust=1),axis.text.x=element_text(family="NanumGothic",color="#000000",size=16,angle=45),axis.text.y=element_text(family="NanumGothic",color="#000000",size=16,angle=45))
💻 출력결과
7) R에서 추세선 그리기
산점도 그래프를 그리는 코드의 geom_point() 함수 다음 라인 위치에 stat_smooth(method = 'lm', se=F, color='black') 를 옵션으로 추가한다.
method='lm' 선형 회귀분석을 수행함. 생략시 국소 회귀분석으로 동작.
se=F 추세선 주변의 표준오차영역(회색음영)을 표시하지 않는다. (권장)
color='색상값' 추세선의 색상을 표시한다.
교통사고 발생 건수와 부상자의 상관관계에 대한 추세선
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
ggplot(data=교통사고,aes(x=발생건수,y=부상자수))+geom_point(size=3,colour='blue')+# 추세선 추가하기stat_smooth(method='lm',se=F,color='#ff0000')+# 배경을 흰색으로 설정theme_bw()+# 그래프 타이틀 설정ggtitle("교통사고 발생건수와 부상자 수의 상관관계")+# x축 제목 설정 --> 표시안함을 위해 빈 문자열 설정xlab("발생건수")+# y축 제목 설정 --> 표시안함을 위해 빈 문자열 설정ylab("부상자수")+# 각 텍스트의 색상, 크기, 각도, 글꼴 설정theme(plot.title=element_text(family="NanumGothic",color="#0066ff",size=25,face="bold"),axis.title.x=element_text(family="NanumGothic",color="#999999",size=18,face="bold"),axis.title.y=element_text(family="NanumGothic",color="#999999",size=18,face="bold",hjust=1),axis.text.x=element_text(family="NanumGothic",color="#000000",size=16,angle=45),axis.text.y=element_text(family="NanumGothic",color="#000000",size=16,angle=45))
💻 출력결과
4) 추세선 분석 결과 확인하기
R에서 (단순) 선형 회귀분석을 진행하는 함수는 lm(). 여기에 summary() 함수까지 같이 쓰면 분석 결과를 한 눈에 볼 수 있다.
ggplot(data=교통사고,aes(x=발생건수,y=부상자수))+geom_point(size=3,colour='blue')+# 추세선 추가하기stat_smooth(method='lm',se=F,color='#ff0000')+# 추세선 수식 추가하기geom_text(x=20000,y=27500,label="y=2.495e+03*발생건수-1.404e+00",family="NanumGothic",size=7)+geom_text(x=20000,y=27000,label="R²=0.8962",family="NanumGothic",size=7)+# 배경을 흰색으로 설정theme_bw()+# 그래프 타이틀 설정ggtitle("교통사고 발생건수와 부상자 수의 상관관계")+# x축 제목 설정 --> 표시안함을 위해 빈 문자열 설정xlab("발생건수")+# y축 제목 설정 --> 표시안함을 위해 빈 문자열 설정ylab("부상자수")+# 각 텍스트의 색상, 크기, 각도, 글꼴 설정theme(plot.title=element_text(family="NanumGothic",color="#0066ff",size=25,face="bold"),axis.title.x=element_text(family="NanumGothic",color="#999999",size=18,face="bold"),axis.title.y=element_text(family="NanumGothic",color="#999999",size=18,face="bold",hjust=1),axis.text.x=element_text(family="NanumGothic",color="#000000",size=16,angle=45),axis.text.y=element_text(family="NanumGothic",color="#000000",size=16,angle=45))