본문 바로가기
728x90

기초통계6

확률의 정의 (기초통계) 표본과 모집단의 이해 포스트에 이어서 작성하는 내용입니다. 2022.03.21 - [공부/기초통계] - 표본과 모집단의 이해 표본과 모집단의 이해 표본과 모집단을 그림으로 그리면 다음과 같이 표현할 수 있습니다. 분석가가 분석 목표로서 대상을 설정하는 전체를 모집단(population)이라고 하며, 조사와 통계기법을 적용한는 모집단의 일부 signature95.tistory.com 먼저 확률의 기본 개념부터 언급하겠습니다. 확률의 기본 개념에는 확률 실험과 표본 공간이라는 것이 존재합니다. 1. 확률 실험 (Random experiment) 실험의 결과를 확실하게 예측하지 못하는 실험을 의미 2. 표본공간 (Sample space) 확률실험의 결과로 얻는 모든 결과 값의 집합을 의미함 이 두 개념의 예시.. 2022. 4. 7.
선형회귀 분석1 (결정계수 구하기) python 이번 포스트에서는 단순선형회귀 summary를 통해 도출된 결정계수, 회귀계수, 회귀계수의 표준편차, 회귀계수의 T값 등의 의미와 직접 구하는 방법을 알아보고자 합니다. 일반적인 OLS를 파이썬에서 수행하려면 다양한 라이브러리가 있지만, summary를 통해 OLS 결과를 종합적으로 도출해주는 statsmodels 라이브러리로 이번 파트를 알아보도록 하겠습니다. 먼저 데이터는 보스턴 집값 데이터를 불러오도록 합니다. import pandas as pd from sklearn.datasets import load_boston # 데이터셋 불러오기 housing = load_boston() # feature, target 데이터 설정 feature = pd.DataFrame(housing.data, colu.. 2022. 4. 1.
표본과 모집단의 이해 표본과 모집단을 그림으로 그리면 다음과 같이 표현할 수 있습니다. 분석가가 분석 목표로서 대상을 설정하는 전체를 모집단(population)이라고 하며, 조사와 통계기법을 적용한는 모집단의 일부는 표본(sample)이라 합니다. 하지만, 모집단에서 추출한 표본통계치는 결과를 예측할 수 없습니다. 그렇기에 표본통계량이 곧 확률변수(확률이 계속 변화하기 때문)로서 작용하는 것이며 이 확률변수의 확률분포는 표본분포(Sample distribution)이라고 정의합니다. 참고로 확률변수와 확률분포의 관계, 의미는 다음과 같습니다. 여기서 만약 확률변수가 동전던지기와 같이 이산적인 값을 가지게 되면 이산확률변수라 칭하며 그런 확률변수의 분포를 이산확률분포라 합니다. 물론 반대로 연속적인 값을 가지는 경우는 연속확.. 2022. 3. 21.
오차, 잔차, 편차의 차이 (기초통계) python 흔히 통계에서는 오차, 잔차, 편차에 대해 얘기하곤 합니다. 그렇다면 이 3가지의 차이는 어떻게 정의되는 것인지 살펴보도록 하겠습니다. 먼저 들어가기 앞서 데이터를 불러옵니다. (삼성전자 주가, 코스피 지수) import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import yfinance as yf # 한글폰트 출력 가능 코드 from matplotlib import rc rc('font', family='AppleGothic') # Mac Os #rc('font', family='NanumGothic') # Windows Os plt.rcParams['axes.unicode_minus'] .. 2022. 3. 19.
Distribution (분포도) python 정규분포, 이항분포, t분포, 카이제곱분포 등 다양한 분포가 존재한다. 이번에는 파이썬을 활용하여 각 분포에 대해 그려보도록 한다. 정규분포 # 정규분포 그리는 함수 def normal_df(N, sigma, mu): # 라이브러리 호출 import numpy as np import scipy as sp import matplotlib.pyplot as plt import seaborn as sns # 한글폰트 출력 가능 코드 from matplotlib import rc rc('font', family='AppleGothic') # Mac Os #rc('font', family='NanumGothic') # Windows Os plt.rcParams['axes.unicode_minus'] = False.. 2022. 2. 10.
기초 통계 (분산) python 이전 포스트에 이어서 작성하는 내용입니다. 2022.02.04 - [공부/통계학] - 기초 통계 (중심도 이해) python 기초 통계 (중심도 이해) python 이번에는 기초 통계에 대해서 알아보도록 하겠습니다. 대표적인 것으로 평균(mean), 중위값(median) 등이 있고, 평균은 산술, 기하, 가중, 절사 평균등 다양하게 표현될 수 있습니다. 먼저 평균에 대 signature95.tistory.com 이번에는 분산에 대해 알아보고자 합니다. 분산은 편차의 제곱 합에 데이터 개수만큼 나눠주면 되는 것인데요, 이를 식으로 쓰면 다음과 같습니다. 확률변수 X의 분산은 X의 기댓값과 X가 얼마나 떨어져 있는지 그 정도를 제곱한 것의 기댓값과 같다. 그렇다면 실습을 해보도록 하겠습니다. 먼저 데이터는 .. 2022. 2. 8.
728x90