728x90 pairplot2 선형회귀 분석1 (결정계수 구하기) python 이번 포스트에서는 단순선형회귀 summary를 통해 도출된 결정계수, 회귀계수, 회귀계수의 표준편차, 회귀계수의 T값 등의 의미와 직접 구하는 방법을 알아보고자 합니다. 일반적인 OLS를 파이썬에서 수행하려면 다양한 라이브러리가 있지만, summary를 통해 OLS 결과를 종합적으로 도출해주는 statsmodels 라이브러리로 이번 파트를 알아보도록 하겠습니다. 먼저 데이터는 보스턴 집값 데이터를 불러오도록 합니다. import pandas as pd from sklearn.datasets import load_boston # 데이터셋 불러오기 housing = load_boston() # feature, target 데이터 설정 feature = pd.DataFrame(housing.data, colu.. 2022. 4. 1. VIF (분산확장요인, python) Feature selection 방법은 크게 3가지로 나뉜다. Filter Method (Feature간 상관성 기반) Wrapper Method (Feature를 조정하며 모형을 형성하고 예측 성능을 참고하여 Feature 선택) Embedded Method (예측 모형 최적화, 회귀계수 추정 과정에서 각 Feature가 선택되는 방식) 이번에 살펴볼 것은 Filter Method 방법인 VIF(Variance Inflation Fector, 분산확장요인)이다. 먼저 VIF의 식을 보면 다음과 같다. VIF는 다중 공선성(Multicollinearity)을 측정하는데 필요한 방법으로 다중공선성이란, 독립변수(feature)간 상관관계가 있는 것을 의미한다. 일반적으로 OLS회귀 가정이나, 여러 회귀와 .. 2022. 1. 11. 이전 1 다음 728x90