[ADsP 복습] 통계와 확률 분포 핵심 개념 완벽 정리
1. 통계 분석의 기초: 모집단과 표본
통계는 특정 집단을 조사하여 얻은 자료를 요약하고 분석하는 학문
- 모집단(Population): 조사하고자 하는 정보의 전체 대상.
- 표본(Sample): 모집단의 일부분으로, 우리가 실제로 조사하는 대상.
- 모수(Parameter): 모집단의 특성을 나타내는 값.
- 통계량(Statistic): 모수를 추론하기 위해 표본에서 구한 요약 수치.
2. 데이터의 종류: 측정 척도
데이터를 어떻게 측정하느냐에 따라 분석 방법이 달라진다.
- 질적 척도 (범주형): 숫자의 크기 차이가 의미 없는 자료
- 명목 척도: 성별, 출생지 등 단순히 분류를 위한 척도
- 순서 척도: 만족도, 학년 등 서열 관계가 있는 척도.
- 양적 척도 (수치형): 숫자 크기 차이를 계산할 수 있는 자료.
- 구간 척도: 온도, 지수 등 속성의 양을 측정.
- 비율 척도: 절대적 '0'이 존재하며 비율 계산이 가능.
3. 확률의 기본 개념
확률은 특정 사건이 일어날 가능성을 수치로 나타낸 것.
독립 사건: 한 사건이 다른 사건에 영향을 주지 않는 관계.
- 배반 사건: 두 사건이 동시에 발생할 수 없는 관계.
- 조건부 확률: 사건 A가 발생했다는 전제하에 사건 B가 발생할 확률.
4. 확률 변수와 확률 분포
확률 실험의 결과를 숫자로 바꾸면 확률 변수가 되고, 이 변수들이 가지는 확률의 패턴을 확률 분포라고 한다.
| 분류 | 특징 | 주요 분포 예시 |
| 이산확률분포 | 값을 셀 수 있는 경우 (확률질량함수) | 베르누이, 이항, 기하 분포 |
| 연속확률분포 | 특정 구간 내 모든 실숫값을 가질 때 (확률밀도함수) | 균일, 정규, t, 카이제곱, F 분포 |
5. 주요 확률 분포 요약
- 정규 분포: 평균을 중심으로 좌우 대칭인 종 모양의 분포로, 가장 대표적인 분포입니다.
- t-분포: 표본이 적을 때 모집단의 평균을 추정하기 위해 사용합니다.
- 카이제곱 분포: 두 집단 간의 동질성 검정이나 모분산 검정에 활용됩니다.
- F-분포: 두 집단 간 분산이 동일한지 검정할 때 사용합니다.
1. 연속확률분포의 시각적 이해
연속확률변수는 특정 구간의 전체 값을 가지기 때문에 그래프 아래의 면적(Integral)이 곧 확률이 됨.
① 균일 분포 (Uniform Distribution)
모든 확률 변수가 구간 내에서 동일한 확률을 가질 때 나타납니다. 그래프는 평평한 직사각형 형태를 띤다.
- 특징: 시작점 a부터 끝점 b까지 높이가 1/(b-a)로 일정함.
- 시각화 포인트: 직사각형의 넓이가 항상 1이 됨을 강조.

② 정규 분포 (Normal Distribution)
자연계와 사회 현상에서 가장 많이 발견되는 분포로, 평균($\mu$)을 중심으로 대칭인 종 모양(Bell-shape).
- 특징: 평균에 데이터가 가장 많이 몰려 있고, 표준편차($\sigma$)가 클수록 그래프가 옆으로 퍼지고 낮아짐.
- 시각화 포인트: 평균 위치의 중심축과 표준편차에 따른 곡선의 기울기 변화.

2. 추론 통계에서 활용되는 주요 분포
표본을 통해 모집단을 추정할 때 사용하는 분포들입니다. 자유도($df$)라는 개념에 따라 그래프 모양이 변하는 것이 특징.
③ t-분포 (t-Distribution)
표본의 크기가 작을 때 모집단의 평균을 추정하기 위해 사용.
- 특징: 표준정규분포와 비슷하게 0을 중심으로 대칭이지만, 양쪽 끝(Tail)이 정규분포보다 더 두껍다.
- 변화: 자유도(표본 수 - 1)가 커질수록 정규분포에 가까워진다.

④ 카이제곱 분포 (Chi-Square Distribution) & F-분포 (F-Distribution)
주로 분산 검정이나 독립성 검정에 사용되며, 항상 0 이상의 값만 가짐.
- 특징: 오른쪽으로 긴 꼬리를 가진 비대칭 형태.
- 변화: 자유도가 커질수록 그래프가 점점 오른쪽으로 이동하며 정규분포와 유사한 대칭형태로 변함.
3. 데이터의 분포 특징을 보여주는 측도
| 개념 | 그래프상의 특징 | 시각적 의미 |
| 왜도 (Skewness) | 꼬리가 어느 쪽으로 긴가? | 양수: 왼쪽 밀집(꼬리 우측) / 음수: 오른쪽 밀집(꼬리 좌측) |
| 첨도 (Kurtosis) | 정규분포보다 얼마나 뾰족한가? | 데이터가 중앙에 얼마나 집중되어 있는지를 나타냄 |
'내일배움캠프(QA,QC_5기)' 카테고리의 다른 글
| [내일배움캠프] QA/QC_5기 ( 38일차 ) (0) | 2026.04.29 |
|---|---|
| [내일배움캠프] QA/QC_5기 ( 37일차 ) (0) | 2026.04.28 |
| [내일배움캠프] QA/QC_5기 ( 35일차 ) (0) | 2026.04.24 |
| [내일배움캠프] QA/QC_5기 ( 34일차 ) (0) | 2026.04.23 |
| [내일배움캠프] QA/QC_5기 ( 33일차 ) (0) | 2026.04.22 |