분산
-
Measures of Dispersion: Range, variance, and standard deviation (데이터의 분산 측정: 범위, 분산, 표준 편차)Machine Learning/Statistics 2025. 3. 20. 19:00
새로운 데이터셋을 탐색할 때, 데이터의 중심뿐만 아니라 값들이 얼마나 퍼져 있는지도 파악하는 것이 중요하다. 중심 경향 측정값(Mean, Median, Mode)만으로는 데이터의 전체 구조를 완전히 이해하기 어렵다. 데이터가 같은 평균을 갖더라도 퍼짐 정도가 다를 수 있기 때문이다. 이를 분석하는 데 사용하는 개념이 바로 분산 측정값(Measures of Dispersion)이다. 분산 측정값이란?분산 측정값은 데이터셋 내 값들의 변동성을 나타낸다. 주요 분산 측정값으로는 범위(Range), 분산(Variance), 표준 편차(Standard Deviation)가 있다.범위(Range): 가장 큰 값과 가장 작은 값의 차이분산(Variance): 데이터 값들이 평균에서 얼마나 떨어져 있는지 측정하는 값 ..