표본과 모집단의 이해 포스트에 이어서 작성하는 내용입니다.
2022.03.21 - [공부/기초통계] - 표본과 모집단의 이해
먼저 확률의 기본 개념부터 언급하겠습니다.
확률의 기본 개념에는 확률 실험과 표본 공간이라는 것이 존재합니다.
1. 확률 실험 (Random experiment)
실험의 결과를 확실하게 예측하지 못하는 실험을 의미
2. 표본공간 (Sample space)
확률실험의 결과로 얻는 모든 결과 값의 집합을 의미함
이 두 개념의 예시를 보면 동전던지기의 앞면 뒷면 결과를 보고 알 수 있습니다.
먼저 동전던지기의 결과는 앞, 뒤로 되어 있지만 사전에 이런 결과를 확실하게 장담하지 못합니다. 단지 확률이 50%인 것만 알고 있는 것이죠.
따라서 동전던지기는 확률실험, {앞면, 뒷면}은 표본 공간에 해당합니다.
3. 사건 (Event)
사건은 실험, 관찰로 인해 발생하는 결과의 집합체입니다. 표본공간의 부분집합에 해당하며 단순사건(simple event : 결과 1개)과 복합사건(compund event : 결과 2개 이상)으로 나뉠 수 있습니다.
4. 상호배타적 사건 (Mutually exclusive event)
동일한 표본 공간에 대해 사건이 2개인 동전던지기 같은 경우, 두 사건을 상호배타적 사건이라고 합니다.
즉 정리하면 다음과 같습니다.
그렇다면 확률의 정의에 대해 알아보도록 하겠습니다.
확률 (Probability)
확률은 사건(A)이 발생할 가능성을 나타내며 0,1 사이의 값이기 때문에 0≤ P(A) ≤1가 성립합니다.
확률의 종류는 3가지가 존재합니다.
- 이론적 확률 : 실험을 하지 않아도 사건에 대한 확률과 모든 사건을 알고 있는 경우
- 실험적 확률 : 실험을 n번 반복하는 경우 특정 사건이 발생한 경우(m)를 극한치로 바꿔 정의 (참고 : 몬테카를로 시뮬레이션 - 링크)
- 주관적 확률 : 도메인지식, 경험적 요소 등 주관성에 의해 측정하는 확률
이처럼 확률의 정의를 알아보았습니다. 여기에는 이런 정의에 따른 여러 법칙이 존재합니다.
하지만 기본적인 것은 제외하고 조건부 확률과 곱셈법칙에 대해 알아보도록 하겠습니다.
조건부 확률 (Conditional probability)
특정 사건이 발생한 조건에서 다른 사건이 발생할 확률을 의미 (기본 선형회귀에서 이 의미가 다시 등장합니다. 링크)
대표적인 예시로 주사위를 보겠습니다.
만약 주사위를 1번 던져 짝수가 나올 확률은 1/2가 됩니다. 그런데 짝수가 나왔을 때를 사건 A라고 하고 6이 나올 확률이 B라고 가정합시다.
그렇게 되면 P(A) = 1/2, P(B) = 1/6이지만 짝수가 나온 조건에서 6이 나올 확률 즉, P(B | A) = 1/3이 됩니다. 이런 관계를 수식으로 표현하면 다음과 같습니다.
여기서 추가로 독립사건(Independent events)이라는 개념이 존재합니다.
한 사건의 발생이 다른 사건의 발생 확률에 영향을 미치지 않는 경우를 의미하며 식으로 표현하면 다음과 같습니다.
여기서 곱셈법칙(Multiplication rule)을 적용하면 다음과 같습니다.
두 사건이 독립이 아닌 경우
두 사건이 독립인 경우
'공부 > 기초통계' 카테고리의 다른 글
Cross correlation (비교상관계수) python (1) | 2022.04.05 |
---|---|
통계적 추론과 바람직한 추정량 python (0) | 2022.03.25 |
표본과 모집단의 이해 (0) | 2022.03.21 |
오차, 잔차, 편차의 차이 (기초통계) python (0) | 2022.03.19 |
confusion matrix (혼동행렬) python (0) | 2022.03.17 |
댓글