본문 바로가기
728x90

단순선형회귀3

선형회귀 분석2 (회귀계수) python 이전 포스트에 이어서 작성하는 내용입니다. 2022.04.01 - [공부/통계학] - 선형회귀 분석1 (결정계수 구하기) python 선형회귀 분석1 (결정계수 구하기) python 이번 포스트에서는 단순선형회귀 summary를 통해 도출된 결정계수, 회귀계수, 회귀계수의 표준편차, 회귀계수의 T값 등의 의미와 직접 구하는 방법을 알아보고자 합니다. 일반적인 OLS를 파이썬에 signature95.tistory.com 앞선 포스트에서는 결정계수에 대해서 알아보았는데, 이번에는 회귀계수에 대해 알아보고자 합니다. 선형회귀에서 회귀계수는 최소제곱법을 통해서 도출하는데, 잔차를 최소화하는 방식으로 진행됩니다. 여기서 잔차를 식으로 표현하면 다음과 같습니다. 위 식에서 우리는 y_hat이 x와 ß로 표현가능한 .. 2022. 4. 1.
선형회귀 분석1 (결정계수 구하기) python 이번 포스트에서는 단순선형회귀 summary를 통해 도출된 결정계수, 회귀계수, 회귀계수의 표준편차, 회귀계수의 T값 등의 의미와 직접 구하는 방법을 알아보고자 합니다. 일반적인 OLS를 파이썬에서 수행하려면 다양한 라이브러리가 있지만, summary를 통해 OLS 결과를 종합적으로 도출해주는 statsmodels 라이브러리로 이번 파트를 알아보도록 하겠습니다. 먼저 데이터는 보스턴 집값 데이터를 불러오도록 합니다. import pandas as pd from sklearn.datasets import load_boston # 데이터셋 불러오기 housing = load_boston() # feature, target 데이터 설정 feature = pd.DataFrame(housing.data, colu.. 2022. 4. 1.
선형회귀 기초 회귀 Regression은 평균으로 회귀하는 경향이 존재한다. 데이터가 산점도 형태로 분포하고 있다고 가정해보자. 이를 회귀선으로 표현해보면 X(feature)가 특정 값을 취하는 경우 Y(target) 값을 밑의 경우와 같이 구할 수 있다. 이를 다시 표현하면, 소득이 100$에서 1000$까지 100$ 단위별로 10개의 집단이 있고 각각 집단 별로 10개의 데이터가 있다고 가정하자. 이는 다시 말하면, X는 10개의 고정된 값과 그 10개의 Y값을 가진다고 할 수 있다. 만약 X1 집단의 Y평균을 알고 싶다면, 식은 E(Y|X1)의 형태로 쓸 수 있다. E(Y|X1)를 조건부 확률값이라 하고 의미는 X1 집단에 대한 Y의 기대치로 X1 집단 내의 Y값 평균을 의미하는 것이다. 예시로 본다면 각 집단별.. 2022. 3. 24.
728x90