편의 샘플링
-
bias in sampling: 샘플링과 편향Machine Learning/Statistics 2025. 4. 9. 19:00
데이터 전문가는 머신러닝 모델을 만들 때 샘플 데이터를 자주 활용한다. 오늘날 머신러닝 모델은 대출 승인, 면접 기회 제공, 정확한 의료 진단 등 다양한 결정에 영향을 줄 수 있다. 대표성 있는 샘플로 구축된 모델은 대출이나 면접 기회 등의 결정을 공정하고 편향 없이 수행할 가능성이 높다. 모집단의 다양한 유형을 대표하는 샘플을 사용하는 것은 각 개인에게 적절한 결과를 제공하는 데 매우 중요하다. 그러나 안타깝게도 샘플 데이터에는 종종 편향(bias)이 존재한다. 샘플링 편향(sampling bias) 은 샘플이 모집단 전체를 제대로 대표하지 못할 때 발생한다. 확률 샘플링 vs 비확률 샘플링최근 학습한 바와 같이, 확률 샘플링(probability sampling) 은 무작위 선택을 사용하여 모집단의..