본문 바로가기
728x90

공부/기초통계9

확률의 정의 (기초통계) 표본과 모집단의 이해 포스트에 이어서 작성하는 내용입니다. 2022.03.21 - [공부/기초통계] - 표본과 모집단의 이해 표본과 모집단의 이해 표본과 모집단을 그림으로 그리면 다음과 같이 표현할 수 있습니다. 분석가가 분석 목표로서 대상을 설정하는 전체를 모집단(population)이라고 하며, 조사와 통계기법을 적용한는 모집단의 일부 signature95.tistory.com 먼저 확률의 기본 개념부터 언급하겠습니다. 확률의 기본 개념에는 확률 실험과 표본 공간이라는 것이 존재합니다. 1. 확률 실험 (Random experiment) 실험의 결과를 확실하게 예측하지 못하는 실험을 의미 2. 표본공간 (Sample space) 확률실험의 결과로 얻는 모든 결과 값의 집합을 의미함 이 두 개념의 예시.. 2022. 4. 7.
Cross correlation (비교상관계수) python 이전에 다룬 ACF, PACF 이후 작성하는 부분입니다. 2022.01.20 - [공부/통계학] - ACF (auto-correlative function, 자기상관함수) python ACF (auto-correlative function, 자기상관함수) python 자기상관함수는 보통 시계열 분석으로 도출된 잔차가 시간의 흐름에 따라 상관성이 존재하는지 확인하는 함수이다. 물론 ARIMA를 시행할 때, p,q를 설정하기 위해서도 ACF를 활용하기도 한다. 이번 signature95.tistory.com 2022.01.20 - [공부/통계학] - PACF (Partial Auto Correlation Function, 편자기상관함수) python ACF (auto-correlative function, .. 2022. 4. 5.
통계적 추론과 바람직한 추정량 python 통계추론의 의미는 모집단으로부터의 표본에 근거하여 모집단에 대한 정보를 알아내는 과정이라 할 수 있습니다. 먼저 통계추론은 추정(estimation)과 가설검정(hypothesis testing)으로 구분되는데, 추정은 표본으로부터 미지의 모수를 추측하는 것으로 다시말해 표본의 통계량으로부터 모수의 특성을 추측하는 것입니다. 여기서 추정량은 모수를 추정하기 위한 표본의 함수인 통계량이며, 추정값은 추정량에 관측값을 대입하여 얻은 추정량의 값입니다. 추정량의 분포는 표본추출결과에 따라 변하며 이를 표로 나타낸 것이 표본분포라고 할 수 있습니다. 그렇다면, 바람직한 추정량에 대해 알아보도록 하겠습니다. 불편성 (Unbiasedness) 不偏, 치우치지 않는 특성 편의 bias는 추정량과 모수가 서로 다른경우.. 2022. 3. 25.
표본과 모집단의 이해 표본과 모집단을 그림으로 그리면 다음과 같이 표현할 수 있습니다. 분석가가 분석 목표로서 대상을 설정하는 전체를 모집단(population)이라고 하며, 조사와 통계기법을 적용한는 모집단의 일부는 표본(sample)이라 합니다. 하지만, 모집단에서 추출한 표본통계치는 결과를 예측할 수 없습니다. 그렇기에 표본통계량이 곧 확률변수(확률이 계속 변화하기 때문)로서 작용하는 것이며 이 확률변수의 확률분포는 표본분포(Sample distribution)이라고 정의합니다. 참고로 확률변수와 확률분포의 관계, 의미는 다음과 같습니다. 여기서 만약 확률변수가 동전던지기와 같이 이산적인 값을 가지게 되면 이산확률변수라 칭하며 그런 확률변수의 분포를 이산확률분포라 합니다. 물론 반대로 연속적인 값을 가지는 경우는 연속확.. 2022. 3. 21.
오차, 잔차, 편차의 차이 (기초통계) python 흔히 통계에서는 오차, 잔차, 편차에 대해 얘기하곤 합니다. 그렇다면 이 3가지의 차이는 어떻게 정의되는 것인지 살펴보도록 하겠습니다. 먼저 들어가기 앞서 데이터를 불러옵니다. (삼성전자 주가, 코스피 지수) import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import yfinance as yf # 한글폰트 출력 가능 코드 from matplotlib import rc rc('font', family='AppleGothic') # Mac Os #rc('font', family='NanumGothic') # Windows Os plt.rcParams['axes.unicode_minus'] .. 2022. 3. 19.
confusion matrix (혼동행렬) python 이전 포스트에 이어서 작성하는 내용입니다. 2022.02.21 - [공부/통계학] - 로지스틱 회귀분석 (Logistic Regression) python 로지스틱 회귀분석 (Logistic Regression) python 이번에는 로지스틱 회귀분석을 시행해보겠습니다. 이 포스트에는 코드 위주로 업로드되며, 관련 이론은 다음을 참고해주세요. 2021.11.16 - [공부/통계학] - 로짓분석 로짓분석 로짓 분석을 설명하 signature95.tistory.com 혼동행렬을 모형의 정확성을 평가하는 지표로 흔히 사용됩니다. 저번 포스트 마지막에도 혼동행렬을 표시했었는데요, 이에 대해 좀 더 자세하게 공부하려 합니다. 로지스틱 회귀분석으로 특정인이 사망할 확률, 생존할 확률은 각각 p, 1-p로 구성되어 .. 2022. 3. 17.
728x90