728x90 기초통계학1 선형회귀 기초 회귀 Regression은 평균으로 회귀하는 경향이 존재한다. 데이터가 산점도 형태로 분포하고 있다고 가정해보자. 이를 회귀선으로 표현해보면 X(feature)가 특정 값을 취하는 경우 Y(target) 값을 밑의 경우와 같이 구할 수 있다. 이를 다시 표현하면, 소득이 100$에서 1000$까지 100$ 단위별로 10개의 집단이 있고 각각 집단 별로 10개의 데이터가 있다고 가정하자. 이는 다시 말하면, X는 10개의 고정된 값과 그 10개의 Y값을 가진다고 할 수 있다. 만약 X1 집단의 Y평균을 알고 싶다면, 식은 E(Y|X1)의 형태로 쓸 수 있다. E(Y|X1)를 조건부 확률값이라 하고 의미는 X1 집단에 대한 Y의 기대치로 X1 집단 내의 Y값 평균을 의미하는 것이다. 예시로 본다면 각 집단별.. 2022. 3. 24. 이전 1 다음 728x90