본문 바로가기

Data Analysis33

다중공선성이란? 제거하는 방법은? 소개 기계 학습과 딥 러닝의 발전으로, 전통적인 통계학에서 처리하지 못했던 문제를 처리할 수 있게 되었습니다. 그러나 이러한 고급 및 복잡한 알고리즘은 또 다른 문제를 발생시켰습니다. 기계 학습 모델의 해석 가능성과 관련하여 선형 회귀의 단순성과 해석 가능성에 가까운 것은 없습니다. 그러나 특히 다중공선성으로 알려진 선형 회귀의 가정이 위반 될 때 선형 회귀의 해석 가능성과 관련하여 특정 문제가있을 수 있습니다. 이 글은 독자가 선형 회귀의 가정에 익숙하다고 가정 하에 진행합니다. 만약 선형회귀에 익숙하지 않은 분이라면 아래 링크를 참조하여“선형 회귀의 가정”에 대한 자세한 내용을 확인하십시오. https://www.analyticsvidhya.com/blog/2016/07/deeper-regressio.. 2023. 1. 11.
기계학습과 다중공선성 단순한 선형 회귀와 다중 회귀 사이의 가정의 유일한 차이는 다중공선성 문제입니다. 다중공선성이란 무엇입니까? 독립 변수 간에 높은 상관 관계가 있을 때, 우리는 일반적으로 다중공선성 또는 상호 상관의 문제가 존재한다고 말합니다. 다중공선성을 감지는 여러 가지 방법이 있습니다. 그중 한 가지 방법은 아래와 같이 상관 행렬을 사용하는 것입니다. 매트릭스는 꽃 잎 길이(petal length, cm)와 꽃 잎 너비(petal width, cm) 사이의 높은 상관 관계를 명확하게 보여줍니다. 다중공선성을 발견하는 또 다른 방법은 분산 인플레이션 계수(VIF)를 계산하는 것입니다. 모델 해석 일반적으로 모델 해석입니다. 목표는 독립 변수 중 하나에서 변경이 발생할 때 종속의 영향 또는 변경을 이해하는 것입니다. .. 2023. 1. 11.
공간 클러스터링: 종류와 사용 * 이 글은 아래 원문을 번역한 글임을 밝힙니다. https://towardsdatascience.com/geospatial-clustering-kinds-and-uses-9aef7601f386 Geospatial Clustering: Kinds and Uses A detailed review of all different kinds of clustering with their uses cases towardsdatascience.com 모든 종류의 공간 클러스터링 사례와 사용법을 자세하게 리뷰한다. 공간 분석은 공간적 객체 세트를 "군집(clusters)"으로 불리는 그룹으로 모으는 방법을 말한다. 군집 안의 객체는 서로 비슷한 특성을 가지는 반면 군집들은 매우 다른 특성을 보인다. 군집의 목적은 공간.. 2021. 8. 20.