728x90 OLS8 구조변화 검정 (Chow-test) python 경제 분석 등 시계열 데이터를 분석하다보면, 특정 큰 사건 발생으로 경제 지표의 큰 변화가 발생하여 이후 예측에 영향을 주는 경우가 존재합니다. 이를 구조변화라고 하는데, 이번에는 구조 변화가 발생했다는 것을 어떻게 통계적으로 검정할 수 있는지 알아보도록 하겠습니다. 참고한 사이트는 다음과 같습니다. https://pypi.org/project/chowtest/ chowtest Python implementation of the Chow test (1960). pypi.org https://github.com/jtloong/chow_test GitHub - jtloong/chow_test: Python module to calculate time series Chow break statistics. Py.. 2022. 4. 8. 선형회귀 분석2 (회귀계수) python 이전 포스트에 이어서 작성하는 내용입니다. 2022.04.01 - [공부/통계학] - 선형회귀 분석1 (결정계수 구하기) python 선형회귀 분석1 (결정계수 구하기) python 이번 포스트에서는 단순선형회귀 summary를 통해 도출된 결정계수, 회귀계수, 회귀계수의 표준편차, 회귀계수의 T값 등의 의미와 직접 구하는 방법을 알아보고자 합니다. 일반적인 OLS를 파이썬에 signature95.tistory.com 앞선 포스트에서는 결정계수에 대해서 알아보았는데, 이번에는 회귀계수에 대해 알아보고자 합니다. 선형회귀에서 회귀계수는 최소제곱법을 통해서 도출하는데, 잔차를 최소화하는 방식으로 진행됩니다. 여기서 잔차를 식으로 표현하면 다음과 같습니다. 위 식에서 우리는 y_hat이 x와 ß로 표현가능한 .. 2022. 4. 1. Monte Carlo simulation (몬테카를로 시뮬레이션) python 이전포스트에 이어서 작성하는 내용입니다. 2022.03.25 - [공부/통계학] - 통계적 추론과 바람직한 추정량 python 통계적 추론과 바람직한 추정량 python 통계추론의 의미는 모집단으로부터의 표본에 근거하여 모집단에 대한 정보를 알아내는 과정이라 할 수 있습니다. 먼저 통계추론은 추정(estimation)과 가설검정(hypothesis testing)으로 구분되는데, signature95.tistory.com 이번에는 지난 포스트에서 언급한 BLUE (Best Lenear Unbiased Estimator)의 특성을 몬테카를로 시뮬레이션으로 증명해보려 합니다. 몬테카를로 시뮬레이션은 표본추출 실험으로서 난수를 생성하여 소표본, 유한표본에서 추정량의 형태에 대해 연구하는데 유용하게 사용합니다... 2022. 3. 28. Ridge regression (릿지 회귀) python 릿지 회귀분석은 선형회귀분석의 과대적합 문제를 해소하기 위해 L2 규제를 적용하는 방식을 사용합니다. 과대 적합은 다음과 같은 표로 해석할 수 있습니다. 전체 Error는 분산과 편향의 제곱 합으로 표시할 수 있습니다. 즉 전체 Error를 최소화하는 회귀분석이 Least Square Method, 즉 OLS인 것입니다. 밑에 식을 한번 보겠습니다. N은 데이터의 개수입니다. 만약 1000개의 샘플데이터가 있다면 N=1000이 되는 것이죠. P는 feature의 개수입니다. 단순선형회귀인 경우에는 P=1이 되고 다중회귀에서는 P가 2이상인 값을 가집니다. y는 실제 target의 값입니다. ß는 가중치로서 OLS의 feature 계수라고 보시면 됩니다. 람다는 ridge 모형의 하이퍼파라미터로 alpha.. 2022. 2. 22. 일원분산분석 (One-way ANOVA) python 분산 분석은 연속형 반응 변수와 범주형 설명 변수를 갖는 데이터를 분석하는 방법 중 하나입니다. 의사결정 흐름도는 다음과 같습니다. 따라서 일원 분산 분석은 연속형 target이 1개고 범주형 feature 1개를 갖는 데이터에서 그룹이 3개 이상인 경우 사용합니다. 동일한 조건에서 그룹이 2개인 경우에는 t-test를 사용합니다. t-test에 대한 포스트는 여기를 참고하시면 됩니다. 2021.11.17 - [공부/통계학] - T-test (T 검정) T-test (T 검정) t 검정의 적용은 언제 하는 것일까? https://ko.wikipedia.org/wiki/T-테스트 t-테스트 - 위키백과, 우리 모두의 백과사전 t-테스트(t-test) 또는 t-검정 또는 스튜던트 t-테스트(Student's.. 2022. 2. 15. Stepwise Feature Selection (단계선택법) python 이전 Wrapper method를 다룬 Backward Feature Selection (후진제거법, python)에 이어서 작성하는 포스트입니다. 2022.01.13 - [공부/모델링] - Backward Feature Selection (후진제거법) python Backward Feature Selection (후진제거법) python 이전 Wrapper method를 다룬 Forward Feature Selection (전진선택법, python)에 이어서 작성하는 포스트입니다. 2022.01.12 - [공부/모델링] - Forward feature selection (전진선택법) python Forward feature s.. signature95.tistory.com Feature selectio.. 2022. 1. 14. 이전 1 2 다음 728x90