ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Conditional Probability: 조건부 확률
    Machine Learning/Statistics 2025. 3. 25. 19:00

    조건부 확률이란? (What is Conditional Probability?)

    지금까지 단일 사건과 두 개 이상의 독립적인 사건(Independent Events)에 대한 확률을 계산하는 방법을 배웠다. 독립적인 사건이란 한 사건이 발생해도 다른 사건의 결과에 영향을 주지 않는 경우를 의미한다. 예를 들어, 두 번의 동전 던지기는 독립적인 사건이다. 첫 번째 던지기의 결과가 두 번째 던지기의 결과에 영향을 주지 않기 때문이다.

     

    이전 글 참고:

    https://g471000.tistory.com/244

    https://g471000.tistory.com/245

     

    이번에는 종속적인 사건(Dependent Events)에 대한 확률을 계산하는 방법을 배운다. 조건부 확률(Conditional Probability)은 한 사건이 이미 발생했을 때, 다른 사건이 발생할 확률을 의미한다.

    조건부 확률은 금융, 보험, 과학, 머신러닝 등 다양한 분야에서 활용된다. 예를 들어:

    • 생명보험 회사는 특정 직업(예: 스카이다이빙 강사)을 가진 사람을 보험에 가입시킬 위험성을 평가하기 위해 조건부 확률을 사용한다.
    • 머신러닝 모델을 개발하는 데이터 전문가는 조건부 확률을 활용하여 복잡한 데이터 세트에서 정확한 예측을 수행한다.

    이제 조건부 확률을 계산하는 방법을 살펴보자.

     

     

    조건부 확률과 종속적인 사건 (Conditional Probability and Dependent Events)

     

    두 개의 사건이 독립적(Independent)이라면, 첫 번째 사건이 발생해도 두 번째 사건의 확률에 영향을 주지 않는다. 하지만 종속적인 사건(Dependent Events)의 경우, 첫 번째 사건이 두 번째 사건의 확률을 변화시킨다.

     

    예를 들어:

    • 웹사이트 방문은 인터넷 연결이 필요하다. 즉, 인터넷 연결이 되어 있어야 웹사이트를 방문할 수 있다.
    • 해외여행을 하려면 여권이 필요하다. 여권이 있어야 해외여행이 가능하다.
    • 트럼프 카드에서 에이스를 뽑은 후 또 다른 에이스를 뽑을 확률은 첫 번째 카드 뽑기 결과에 의해 달라진다.

    예제: 트럼프 카드 덱에서 두 장의 에이스를 연속으로 뽑는 경우

    1. 52장의 카드 중 에이스는 4장이다. 따라서 첫 번째로 에이스를 뽑을 확률은 4/52 (7.8%)이다.
    2. 첫 번째 에이스가 제거된 후 남은 카드 수는 51장이며, 에이스는 3장 남아 있다. 따라서 두 번째로 에이스를 뽑을 확률은 3/51 (5.8%)이다.
    3. 두 사건이 종속적이므로, 두 번 연속으로 에이스를 뽑을 확률은 (4/52) × (3/51) = 1/221 ≈ 0.5%이다.

    이제 조건부 확률을 계산하는 공식에 대해 살펴보자.

     

     

    조건부 확률 공식 (Formula for Conditional Probability)

    두 개의 종속적인 사건 A와 B가 있을 때, A와 B가 모두 발생할 확률은 다음과 같이 계산된다:

    P(A and B) = P(A) × P(B | A)

     

    여기서 P(B | A)A가 발생했을 때 B가 발생할 확률을 의미하며, 기호 |는 "A가 발생했을 때 B의 확률"을 나타낸다.

    또한, 공식은 다음과 같이 변형될 수도 있다:

    P(B | A) = P(A  and B) / P(A)

     

    이 두 가지 방식은 같은 의미를 가지며, 주어진 정보에 따라 더 적절한 방법을 선택할 수 있다.

     

    참고: 독립적인 사건의 경우 P(B | A) = P(B)가 성립하므로, 공식을 변형하면 P(A and B) = P(A) × P(B)가 된다. 이는 앞에서 배운 곱셈 규칙(Multiplication Rule)과 동일하다.

     

     

     

    예제 1: 트럼프 카드 뽑기 (Playing Cards)

    조건부 확률의 개념을 적용하기 위해, 52장의 표준 트럼프 카드 덱을 사용한 예제를 살펴보자.

     

    두 개의 사건:

    1. 첫 번째 카드에서 하트를 뽑는 사건(A)
    2. 두 번째 카드에서 다시 하트를 뽑는 사건(B)

    첫 번째 사건 A에서 하트를 뽑을 확률:

    • 한 덱에는 4가지 무늬(하트, 다이아몬드, 스페이드, 클럽)가 있으며, 각 무늬당 13장의 카드가 있다.
    • 따라서 첫 번째 뽑기에서 하트를 뽑을 확률은 13/52 = 25%이다.

    첫 번째 카드가 하트였을 경우, 두 번째 카드에서 하트를 뽑을 확률(B | A):

    • 첫 번째 카드가 제거되었으므로, 덱에는 이제 51장이 남아 있고, 하트는 12장 남아 있다.
    • 따라서 두 번째 뽑기에서 하트를 뽑을 확률은 12/51 = 23.5%이다.

    이를 조건부 확률 공식에 대입하면:

    P(1st heart and 2nd heart) = P(1st heart) × P(2nd heart | 1st heart)
    = (13/52) × (12/51) = 1/17 ≈ 5.9%

     

    즉, 연속으로 하트를 두 장 뽑을 확률은 5.9%이다.

     

     

    예제 2: 온라인 쇼핑 (Online Purchases)

    이제 비즈니스 사례를 살펴보자. 온라인 쇼핑몰에서 고객의 구매 패턴을 분석하는 데이터 전문가라고 가정해보자.

     

    두 개의 사건:

    1. 고객이 100달러 이상을 지출하는 사건(A)
    2. 고객이 무료 기프트 카드를 받는 사건(B)
    • 쇼핑몰 데이터에 따르면, 고객의 20%가 100달러 이상을 지출한다. → P(A) = 0.2
    • 100달러 이상을 지출한 고객 중 10%가 랜덤으로 기프트 카드를 받는다. → P(B | A) = 0.1

    이를 조건부 확률 공식에 대입하면:

    P(100달러 이상 구매 그리고 기프트 카드 받기)
    = P(100달러 이상 구매) × P(기프트 카드 받기 | 100달러 이상 구매)
    = 0.2 × 0.1 = 0.02
    = 2%

    즉, 고객이 100달러 이상을 지출하고 기프트 카드를 받을 확률은 2%이다.


    핵심 정리 (Key Takeaways)

    • 조건부 확률(Conditional Probability): 하나의 사건이 이미 발생했을 때, 다른 사건이 발생할 확률을 나타낸다.
    • 종속적인 사건(Dependent Events): 첫 번째 사건이 두 번째 사건의 확률을 변화시키는 경우.
    • 조건부 확률 공식:
      • P(A and B) = P(A) × P(B | A)
      • P(B | A) = P(A and B) / P(A)
    • 비즈니스 및 데이터 분석 활용 사례:
      • 머신러닝 모델에서 특정 데이터 패턴 예측
      • 보험 업계에서 특정 위험 요소 평가
      • 마케팅에서 광고 캠페인의 매출 영향 분석

     

    참고자료:

    Conditional Probability에 대한 INVESTOPEDIA의 글

    댓글

Designed by Tistory.