패키지 설치 방법
- ggplot2와 dplyr 패키지 설치 방법 기재
1 2
| install.package("ggplot2") install.package("dplyr")
|
패키지 설치
1 2
| library(ggplot2) library(dplyr)
|
라이브러리 연결
액셀 데이터 받아오기
1 2
| counties <- readxl::read_xlsx("파일위치/파일이름.xslx", sheet = 1) glimpse(counties)
|
getwd()로 위치확인 후 진행할 것에 주의
glimpse는 현재 데이터를 보여줌
private_work, unemployment를 활용하여 산점도를 작성
1 2 3 4 5
| ggplot(data = counties, aes(x = private_work, y = unemployment, colour = region)) geom_point()
|
dplyr 함수를 활용하여, 아래 데이터 요약
- counties 데이터를 활용합니다.
- 변수 추출은 region, state, men, women
- 각 region, state 별 men, wemen 전체 인구수를 구함.
- 최종 데이터셋 저장 이름은 final_df로 명명
1 2 3 4 5 6 7 8 9
| counties %>% select(region, state, county, men, women) %>% group_by(region, state) %>% summarize(total_men = sum(men), total_women = sum(women)) %>% filter(region == "North Central") %>% arrange(desc(total_men)) -> final_df
glimpse(final_df)
|
final_df를 기준으로 막대 그래프를 그린다.
- x축 : state
- 1개의 region만 선택
1 2
| ggplot(final_df, aes(x = state, y = total_men)) + geom_col()
|