본문 바로가기

전체 글47

[R] 설치하기 R은 통계 분석과 그래픽을 위한 언어이자 환경이다. 몇 가지 장점이 있는데, 1) 오픈소스로 무료로 사용할 수 있는데, 원하는 모든 패키지가 오픈소스로 제공되고(데이터 전처리, 통계, 머신러닝 등), 2) 다양하고 화려한 그래픽 기능을 제공해주며, 3) 커뮤니티를 통해 맞닥뜨린 문제를 원활히 해결할수 있다. 1. R을 다운받기 위해서 아래 사이트에 접속한다 http://www.r-project.org/ R: The R Project for Statistical Computing www.r-project.org 2. Download 카테고리에 CRAN을 클릭하면, 3. 나의 OS에 따라 선택하여 다운받을 수 있다. 윈도우에 설치하고 싶으면, Download R for Windows를 클릭한다. 4. 아래와.. 2023. 1. 12.
다중공선성이란? 제거하는 방법은? 소개 기계 학습과 딥 러닝의 발전으로, 전통적인 통계학에서 처리하지 못했던 문제를 처리할 수 있게 되었습니다. 그러나 이러한 고급 및 복잡한 알고리즘은 또 다른 문제를 발생시켰습니다. 기계 학습 모델의 해석 가능성과 관련하여 선형 회귀의 단순성과 해석 가능성에 가까운 것은 없습니다. 그러나 특히 다중공선성으로 알려진 선형 회귀의 가정이 위반 될 때 선형 회귀의 해석 가능성과 관련하여 특정 문제가있을 수 있습니다. 이 글은 독자가 선형 회귀의 가정에 익숙하다고 가정 하에 진행합니다. 만약 선형회귀에 익숙하지 않은 분이라면 아래 링크를 참조하여“선형 회귀의 가정”에 대한 자세한 내용을 확인하십시오. https://www.analyticsvidhya.com/blog/2016/07/deeper-regressio.. 2023. 1. 11.
기계학습과 다중공선성 단순한 선형 회귀와 다중 회귀 사이의 가정의 유일한 차이는 다중공선성 문제입니다. 다중공선성이란 무엇입니까? 독립 변수 간에 높은 상관 관계가 있을 때, 우리는 일반적으로 다중공선성 또는 상호 상관의 문제가 존재한다고 말합니다. 다중공선성을 감지는 여러 가지 방법이 있습니다. 그중 한 가지 방법은 아래와 같이 상관 행렬을 사용하는 것입니다. 매트릭스는 꽃 잎 길이(petal length, cm)와 꽃 잎 너비(petal width, cm) 사이의 높은 상관 관계를 명확하게 보여줍니다. 다중공선성을 발견하는 또 다른 방법은 분산 인플레이션 계수(VIF)를 계산하는 것입니다. 모델 해석 일반적으로 모델 해석입니다. 목표는 독립 변수 중 하나에서 변경이 발생할 때 종속의 영향 또는 변경을 이해하는 것입니다. .. 2023. 1. 11.
탄소포집설비는 탄소중립의 미래가 될 수 있을까? 기후변화 문제가 나타나면서 대기 중 이산화탄소의 농도를 줄이기 위한 다양한 대안이 제시되고 있다. 탄소포집설비(이하 CCS, Carbon Capture and Storage)는 이산화탄소를 내뿜는 산업을 축소하지 않으면서 대기 중 온실가스를 저감할 수 있다는 점때문에 각광받는 기술이다(처음에는 CCS라고 주로 쓰이다가 어느 순간 활용(Utilization)을 포함하여 CCUS라고 불리우고 있다). 우리나라는 물론 세계 곳곳에서 CCS가 이산화탄소 완화 정책의 중요한 요인으로 제시된다. 세계에너지기구(IEA, 2015)는 2도씨 경로 기술별 누적감축 기여율에서 CCS가 13% 정도를 담당하도록 제안하고 있으며, IPCC에서도 완화정책으로써 CCS의 필요성을 제시한다. 2021년 10월 18일 정부(탄소중립.. 2022. 1. 4.
공간 클러스터링: 종류와 사용 * 이 글은 아래 원문을 번역한 글임을 밝힙니다. https://towardsdatascience.com/geospatial-clustering-kinds-and-uses-9aef7601f386 Geospatial Clustering: Kinds and Uses A detailed review of all different kinds of clustering with their uses cases towardsdatascience.com 모든 종류의 공간 클러스터링 사례와 사용법을 자세하게 리뷰한다. 공간 분석은 공간적 객체 세트를 "군집(clusters)"으로 불리는 그룹으로 모으는 방법을 말한다. 군집 안의 객체는 서로 비슷한 특성을 가지는 반면 군집들은 매우 다른 특성을 보인다. 군집의 목적은 공간.. 2021. 8. 20.