변수명 변경
1. rename()
# 데이터 프레임 변수명을 변경하는 함수이다.
# 샘플로 Cars93 데이터 프레임 내 변수명을 확인한다.
library(MASS)
names(Cars93)
# Cars93 데이터 프레임의 1~5번째 변수만 선택한 후 names()로 변수명을 변경한다.
# 변경하는 컬럼의 이름을 아래와 같이 직접 써줄 수 있다.
Cars93_subset <- Cars93[,c(1:5)]
names(Cars93_subset)
names(Cars93_subset) <- c("V1", "V2", "V3", "V4", "V5")
names(Cars93_subset)
2. dplyr (추천)
# dplyr를 사용하여 데이터 프레임의 변수명을 변경할 수 있다.
install.packages("dplyr")
library(dplyr)
Cars93_subset <- select(Cars93_subset,
V1_Manufacturer = V1,
V2_Model = V2,
V3_Type = V3,
V4_Min.Price = V4,
V5_Price = V5)
names(Cars93_subset)
Cars93_subset
# dplyr에서는 select 함수를 사용하여 데이터 프레임, 변경하고 싶은 변수의 이름을 직접 설정할 수 있다.
# 참고로 select 함수를 사용하여 특정 변수를 선택할 수 있다.
# 예를 들어, min.price가 10 이하인 자동차를 선택하는 방법은 아래와 같다.
Cars93_subset %>%
select(V1_Manufacturer, V4_Min.Price, V5_Price) %>%
filter(V4_Min.Price <= 10)
변수 생성
# 신규 변수는 아래와 같이 데이터 프레임에 변수량을 직접 입력하여 생성할 수 있다.
height <- c(175, 159, 166, 189, 189, 171, 173, 179, 167, 182, 170)
weight <- c(62, 55, 59, 80, 75, 61, 64, 63, 65, 70, 60)
hwdf <- data.frame(height, weight)
hwdf
# 체질량 지수(BMI) 공식에 따른 신규 변수 생성 (1)
options(digits=4) # 숫자 개수 지정해주는 옵션
hwdf$bmi_1 <- hwdf$weight/(hwdf$height/100)^2
hwdf
# 체질량 지수(BMI) 공식에 따른 신규 변수 생성 (2)
hwdf <- transform(hwdf,
bmi_2 = weight/(height/100)^2)
hwdf
'R' 카테고리의 다른 글
[R] GPT-3.5가 답변한 회귀분석 과정 (0) | 2023.11.15 |
---|---|
[R] 데이터 처리 (1) | 2023.10.03 |
[R] 기술 통계 및 그래프 기초 (0) | 2023.09.19 |
[R] 데이터 관리 (0) | 2023.09.18 |
[R] 기초 (0) | 2023.09.17 |
댓글