728x90 python30 기초 통계 (분산) python 이전 포스트에 이어서 작성하는 내용입니다. 2022.02.04 - [공부/통계학] - 기초 통계 (중심도 이해) python 기초 통계 (중심도 이해) python 이번에는 기초 통계에 대해서 알아보도록 하겠습니다. 대표적인 것으로 평균(mean), 중위값(median) 등이 있고, 평균은 산술, 기하, 가중, 절사 평균등 다양하게 표현될 수 있습니다. 먼저 평균에 대 signature95.tistory.com 이번에는 분산에 대해 알아보고자 합니다. 분산은 편차의 제곱 합에 데이터 개수만큼 나눠주면 되는 것인데요, 이를 식으로 쓰면 다음과 같습니다. 확률변수 X의 분산은 X의 기댓값과 X가 얼마나 떨어져 있는지 그 정도를 제곱한 것의 기댓값과 같다. 그렇다면 실습을 해보도록 하겠습니다. 먼저 데이터는 .. 2022. 2. 8. 기초 통계 (중심도 이해) python 이번에는 기초 통계에 대해서 알아보도록 하겠습니다. 대표적인 것으로 평균(mean), 중위값(median) 등이 있고, 평균은 산술, 기하, 가중, 절사 평균등 다양하게 표현될 수 있습니다. 먼저 평균에 대해서 알아보도록 합니다. 코드는 다음과 같습니다. import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import numpy as np data = pd.read_csv("https://raw.githubusercontent.com/signature95/tistory/main/dataset/boston.csv") print(data) >>> CRIM ZN INDUS CHAS NOX RM AGE DIS RAD TAX \ 0 .. 2022. 2. 4. pymysql를 해보자 pymysql은 mysql에 파이썬으로 접속할 수 있는 라이브러리다. https://pypi.org/project/PyMySQL/ PyMySQL Pure Python MySQL Driver pypi.org 즉, mysql 명령어를 사용하여 파이썬에서도 이를 활용할 수 있다는 의미다. 따라서 이번 포스트에서는 간단하게 pymysql을 이용하여 데이터 베이스에 접근해보도록 한다. 코드는 다음과 같다. 먼저 라이브러리를 다운받자 pip install PyMySQL 그런다음 데이터베이스를 형성해 볼 것이다. import pymysql conn = pymysql.connect(host='localhost', user='root', password='jjms7794', charset='utf8') # conn = .. 2022. 1. 20. PACF (Partial Auto Correlation Function, 편자기상관함수) python ACF와 같이 확인하는 부분이 PACF이다. 간단하게 말하면 편미분을 활용하는것으로 lag = 2인 경우, lag = n을 배제하고 lag=2와 lag=0의 편미분계수를 구하는 것이다. ACF는 앞 포스트에서 다룬 것을 참고하면 된다. 2022.01.20 - [공부/모델링] - ACF (auto-correlative function, 자기상관함수) python ACF (auto-correlative function, 자기상관함수) python 자기상관함수는 보통 시계열 분석으로 도출된 잔차가 시간의 흐름에 따라 상관성이 존재하는지 확인하는 함수이다. 물론 ARIMA를 시행할 때, p,q를 설정하기 위해서도 ACF를 활용하기도 한다. 이번 signature95.tistory.com 데이터는 divvy_da.. 2022. 1. 20. ACF (auto-correlative function, 자기상관함수) python 자기상관함수는 보통 시계열 분석으로 도출된 잔차가 시간의 흐름에 따라 상관성이 존재하는지 확인하는 함수이다. 물론 ARIMA를 시행할 때, p,q를 설정하기 위해서도 ACF를 활용하기도 한다. 이번에는 자기상관성을 검정하고 이를 도표화하는 법을 알아보도록 한다. 데이터는 divvy data를 사용했으며 앞선 포스트에 이어지는 내용이기도 하다. 2022.01.19 - [공부/모델링] - Differential (차분) python Differential (차분) python 차분을 하는 이유는 non-stationary한 데이터를 차분을 통해 stationary하게 만들어주는 것이다. 데이터를 안정화하는 작업은 제곱, 로그화, 루트, 차분이 있는데 이번에는 차분을 해볼 것이다. 정상성 signature95.. 2022. 1. 20. Differential (차분) python 차분을 하는 이유는 non-stationary한 데이터를 차분을 통해 stationary하게 만들어주는 것이다. 데이터를 안정화하는 작업은 제곱, 로그화, 루트, 차분이 있는데 이번에는 차분을 해볼 것이다. 정상성에 대해서는 다음 포스트를 참고하면 된다. 2022.01.19 - [공부/모델링] - Stationary test (정상성 검정) python Stationary test (정상성 검정) python 시계열 데이터를 다루게 된다면, 정상성 검정이라는 것을 시행해야 한다. 시계열 데이터를 통해 회귀를 하게 된다면, 이는 과거 데이터를 가지고 미래를 예측하는 것과 같다. 따라서 통계적 속 signature95.tistory.com 이번에는 정상성 검정 포스트에서 다룬 데이터를 기반으로 차분을 진행해.. 2022. 1. 19. 이전 1 2 3 4 5 다음 728x90