본문 바로가기
728x90

파이썬28

pymysql를 해보자 pymysql은 mysql에 파이썬으로 접속할 수 있는 라이브러리다. https://pypi.org/project/PyMySQL/ PyMySQL Pure Python MySQL Driver pypi.org 즉, mysql 명령어를 사용하여 파이썬에서도 이를 활용할 수 있다는 의미다. 따라서 이번 포스트에서는 간단하게 pymysql을 이용하여 데이터 베이스에 접근해보도록 한다. 코드는 다음과 같다. 먼저 라이브러리를 다운받자 pip install PyMySQL 그런다음 데이터베이스를 형성해 볼 것이다. import pymysql conn = pymysql.connect(host='localhost', user='root', password='jjms7794', charset='utf8') # conn = .. 2022. 1. 20.
PACF (Partial Auto Correlation Function, 편자기상관함수) python ACF와 같이 확인하는 부분이 PACF이다. 간단하게 말하면 편미분을 활용하는것으로 lag = 2인 경우, lag = n을 배제하고 lag=2와 lag=0의 편미분계수를 구하는 것이다. ACF는 앞 포스트에서 다룬 것을 참고하면 된다. 2022.01.20 - [공부/모델링] - ACF (auto-correlative function, 자기상관함수) python ACF (auto-correlative function, 자기상관함수) python 자기상관함수는 보통 시계열 분석으로 도출된 잔차가 시간의 흐름에 따라 상관성이 존재하는지 확인하는 함수이다. 물론 ARIMA를 시행할 때, p,q를 설정하기 위해서도 ACF를 활용하기도 한다. 이번 signature95.tistory.com 데이터는 divvy_da.. 2022. 1. 20.
ACF (auto-correlative function, 자기상관함수) python 자기상관함수는 보통 시계열 분석으로 도출된 잔차가 시간의 흐름에 따라 상관성이 존재하는지 확인하는 함수이다. 물론 ARIMA를 시행할 때, p,q를 설정하기 위해서도 ACF를 활용하기도 한다. 이번에는 자기상관성을 검정하고 이를 도표화하는 법을 알아보도록 한다. 데이터는 divvy data를 사용했으며 앞선 포스트에 이어지는 내용이기도 하다. 2022.01.19 - [공부/모델링] - Differential (차분) python Differential (차분) python 차분을 하는 이유는 non-stationary한 데이터를 차분을 통해 stationary하게 만들어주는 것이다. 데이터를 안정화하는 작업은 제곱, 로그화, 루트, 차분이 있는데 이번에는 차분을 해볼 것이다. 정상성 signature95.. 2022. 1. 20.
Differential (차분) python 차분을 하는 이유는 non-stationary한 데이터를 차분을 통해 stationary하게 만들어주는 것이다. 데이터를 안정화하는 작업은 제곱, 로그화, 루트, 차분이 있는데 이번에는 차분을 해볼 것이다. 정상성에 대해서는 다음 포스트를 참고하면 된다. 2022.01.19 - [공부/모델링] - Stationary test (정상성 검정) python Stationary test (정상성 검정) python 시계열 데이터를 다루게 된다면, 정상성 검정이라는 것을 시행해야 한다. 시계열 데이터를 통해 회귀를 하게 된다면, 이는 과거 데이터를 가지고 미래를 예측하는 것과 같다. 따라서 통계적 속 signature95.tistory.com 이번에는 정상성 검정 포스트에서 다룬 데이터를 기반으로 차분을 진행해.. 2022. 1. 19.
Stationary test (정상성 검정) python 시계열 데이터를 다루게 된다면, 정상성 검정이라는 것을 시행해야 한다. 시계열 데이터를 통해 회귀를 하게 된다면, 이는 과거 데이터를 가지고 미래를 예측하는 것과 같다. 따라서 통계적 속성이 일정해야 미래 데이터의 예측에 대한 신뢰성이 보장된다고 할 수 있을 것이다. 다음 그래프를 살펴보자 1번째 그래프는 정상성이 보장된 그래프이다. 이를 보면, 데이터의 분산이 평균을 중심으로 시간의 흐름에 따라 일정하게 유지되는 것을 확인할 수 있다. 반면 2번째 그래프는 분산이 일정하지 않고 추세도 하향하는 것을 볼 수 있다. 그렇다면, 회귀분석을 통해 미래를 예측하는 것은 아무래도 1번째 그래프가 더 쉬워보이는 것을 육안으로도 확인할 수 있을 것이다. 하지만, 표를 그려서 확인하는 것보다는 통계적인 검정을 활용하여.. 2022. 1. 19.
Backward Feature Selection (후진제거법) python 이전 Wrapper method를 다룬 Forward Feature Selection (전진선택법, python)에 이어서 작성하는 포스트입니다. 2022.01.12 - [공부/모델링] - Forward feature selection (전진선택법) python Forward feature selection (전진선택법) python 이전 filter method를 다룬 VIF (분산확장요인, python)에 이어서 작성하는 포스트입니다. 2022.01.11 - [공부/모델링] - VIF (분산확장요인, python) VIF (분산확장요인, python) Feature selection 방법은 크게.. signature95.tistory.com Feature selection 방법은 크게 3가지로 나뉜다.. 2022. 1. 13.
728x90