본문 바로가기

R8

[R] 선형회귀분석_단순회귀 여기에서는 R을 사용하여 선형 회귀분석을 실습해 본다. 아래 실습의 자료는 Machine Learning with R(2nd Ed. p.263)를 참고했으며, 상세한 설명을 보고 싶은 분은 원문을 참고하기를 추천한다. 저자가 제공하는 깃허브 사이트는 아래와 같다. https://github.com/PacktPublishing/Machine-Learning-with-R-Second-Edition [선형회귀를 이용한 의료비 예측] 1. 목적: 환자 데이터를 이용해 인구 세그먼트별로 평균 의료비를 추정하기 2. 사용대상: 보험회사가 각 인구대상별로 의료비를 추정하는데 사용 Working Directory 설정하기 setwd("D:/Rpractice") # / 대신 \\을 쓸 수 있음 # 한글명이 없을 수록 에.. 2023. 11. 16.
[R] GPT-3.5가 답변한 회귀분석 과정 갑자기 궁금한 마음이 들어 GPT-3.5에게 회귀분석 방법을 설명해달라고 했다. 결과적으로 핵심적인 내용을 심플하고 정확하게 전달하더라.ㅎㅎㅎ 앞으로 R이나 파이썬 언어를 배우지 않더라도 GPT를 이용하면 왠만한 방법론은 사용할 수 있을 것 같다. 물론 무료버전이어서 최신 개발된 알고리즘을 따라가기는 어렵겠지만. 1. 데이터 불러오기 먼저, 데이터를 불러와야 합니다. `read.csv()`, `read.table()` 또는 다른 데이터 불러오기 함수를 사용할 수 있습니다. # 예시: 데이터 불러오기 data 2023. 11. 15.
[R] 데이터 처리 데이터 정렬 앞에 글에서 생성했던 hwdf 변수를 사용하여 데이터를 정렬해보자. sort는 오름차순으로 정리해주는 함수이다. sort함수의 decreasing 옵션을 사용하면 내림차순으로 정리해준다. order는 변수 데이터 크기의 순위를 나타낸다. hwdf 2023. 10. 3.
[R] 데이터 처리 - 변수 변환 변수명 변경 1. rename() # 데이터 프레임 변수명을 변경하는 함수이다. # 샘플로 Cars93 데이터 프레임 내 변수명을 확인한다. library(MASS) names(Cars93) # Cars93 데이터 프레임의 1~5번째 변수만 선택한 후 names()로 변수명을 변경한다. # 변경하는 컬럼의 이름을 아래와 같이 직접 써줄 수 있다. Cars93_subset 2023. 9. 22.
[R] 기술 통계 및 그래프 기초 여기에서는 R에서 제공하는 ISLR 라이브러리를 사용해서 간단한 기술통계를 도출해 보겠습니다. 1. ISLR 라이브러리를 불러옵니다. library(ISLR) 2. ISLR 라이브러리에는 Auto라는 데이터 샘플이 있습니다. - Auto를 불러와서 myData라는 데이터를 만들어 줍니다. Auto는 9개의 변수, 392개 관측값으로 구성된 데이터입니다. - names function을 사용해서 변수명을 확인합니다. myData는 "mpg", "cylinders", "displacement", "horsepower", "weight", "acceleration" , "year" , "origin" , "name" 변수로 구성되어 있음을 확인했습니다. myData 2023. 9. 19.
[R] 데이터 관리 데이터 불러오기 # 연구자가 가공한 데이터나 행렬을 내 컴퓨터에 저장하거나 불러오도록 해 보겠습니다. # 객체 m, m1, myData를 RData로 저장하고 나중에 불러올 수 있습니다. # RData로 저장하기 save(myData, file = "FirstData.RData") # 'FirstData.RData'는 이전에 설정한 폴더에 저장됩니다. # 일단 Global Env에 있는 모든 객체들을 지우도록 하겠습니다. rm(list=ls()) # 저장한 RData 불러오기 (전에 저장한 'FirstData.RData"를 불러오겠습니다.) load("FirstData.RData") # Global Env.에 전에 작업한 데이터프레임과 행렬들이 보입니다. CSV파일 저장하기 # myData의 일부를 CS.. 2023. 9. 18.