-
Conditional Probability: 조건부 확률Machine Learning/Statistics 2025. 3. 25. 19:00
조건부 확률이란? (What is Conditional Probability?)
지금까지 단일 사건과 두 개 이상의 독립적인 사건(Independent Events)에 대한 확률을 계산하는 방법을 배웠다. 독립적인 사건이란 한 사건이 발생해도 다른 사건의 결과에 영향을 주지 않는 경우를 의미한다. 예를 들어, 두 번의 동전 던지기는 독립적인 사건이다. 첫 번째 던지기의 결과가 두 번째 던지기의 결과에 영향을 주지 않기 때문이다.
이전 글 참고:
https://g471000.tistory.com/244
https://g471000.tistory.com/245
이번에는 종속적인 사건(Dependent Events)에 대한 확률을 계산하는 방법을 배운다. 조건부 확률(Conditional Probability)은 한 사건이 이미 발생했을 때, 다른 사건이 발생할 확률을 의미한다.
조건부 확률은 금융, 보험, 과학, 머신러닝 등 다양한 분야에서 활용된다. 예를 들어:
- 생명보험 회사는 특정 직업(예: 스카이다이빙 강사)을 가진 사람을 보험에 가입시킬 위험성을 평가하기 위해 조건부 확률을 사용한다.
- 머신러닝 모델을 개발하는 데이터 전문가는 조건부 확률을 활용하여 복잡한 데이터 세트에서 정확한 예측을 수행한다.
이제 조건부 확률을 계산하는 방법을 살펴보자.
조건부 확률과 종속적인 사건 (Conditional Probability and Dependent Events)
두 개의 사건이 독립적(Independent)이라면, 첫 번째 사건이 발생해도 두 번째 사건의 확률에 영향을 주지 않는다. 하지만 종속적인 사건(Dependent Events)의 경우, 첫 번째 사건이 두 번째 사건의 확률을 변화시킨다.
예를 들어:
- 웹사이트 방문은 인터넷 연결이 필요하다. 즉, 인터넷 연결이 되어 있어야 웹사이트를 방문할 수 있다.
- 해외여행을 하려면 여권이 필요하다. 여권이 있어야 해외여행이 가능하다.
- 트럼프 카드에서 에이스를 뽑은 후 또 다른 에이스를 뽑을 확률은 첫 번째 카드 뽑기 결과에 의해 달라진다.
예제: 트럼프 카드 덱에서 두 장의 에이스를 연속으로 뽑는 경우
- 52장의 카드 중 에이스는 4장이다. 따라서 첫 번째로 에이스를 뽑을 확률은 4/52 (7.8%)이다.
- 첫 번째 에이스가 제거된 후 남은 카드 수는 51장이며, 에이스는 3장 남아 있다. 따라서 두 번째로 에이스를 뽑을 확률은 3/51 (5.8%)이다.
- 두 사건이 종속적이므로, 두 번 연속으로 에이스를 뽑을 확률은 (4/52) × (3/51) = 1/221 ≈ 0.5%이다.
이제 조건부 확률을 계산하는 공식에 대해 살펴보자.
조건부 확률 공식 (Formula for Conditional Probability)
두 개의 종속적인 사건 A와 B가 있을 때, A와 B가 모두 발생할 확률은 다음과 같이 계산된다:
P(A and B) = P(A) × P(B | A)
여기서 P(B | A)는 A가 발생했을 때 B가 발생할 확률을 의미하며, 기호 |는 "A가 발생했을 때 B의 확률"을 나타낸다.
또한, 공식은 다음과 같이 변형될 수도 있다:
P(B | A) = P(A and B) / P(A)
이 두 가지 방식은 같은 의미를 가지며, 주어진 정보에 따라 더 적절한 방법을 선택할 수 있다.
참고: 독립적인 사건의 경우 P(B | A) = P(B)가 성립하므로, 공식을 변형하면 P(A and B) = P(A) × P(B)가 된다. 이는 앞에서 배운 곱셈 규칙(Multiplication Rule)과 동일하다.
예제 1: 트럼프 카드 뽑기 (Playing Cards)
조건부 확률의 개념을 적용하기 위해, 52장의 표준 트럼프 카드 덱을 사용한 예제를 살펴보자.
두 개의 사건:
- 첫 번째 카드에서 하트를 뽑는 사건(A)
- 두 번째 카드에서 다시 하트를 뽑는 사건(B)
첫 번째 사건 A에서 하트를 뽑을 확률:
- 한 덱에는 4가지 무늬(하트, 다이아몬드, 스페이드, 클럽)가 있으며, 각 무늬당 13장의 카드가 있다.
- 따라서 첫 번째 뽑기에서 하트를 뽑을 확률은 13/52 = 25%이다.
첫 번째 카드가 하트였을 경우, 두 번째 카드에서 하트를 뽑을 확률(B | A):
- 첫 번째 카드가 제거되었으므로, 덱에는 이제 51장이 남아 있고, 하트는 12장 남아 있다.
- 따라서 두 번째 뽑기에서 하트를 뽑을 확률은 12/51 = 23.5%이다.
이를 조건부 확률 공식에 대입하면:
P(1st heart and 2nd heart) = P(1st heart) × P(2nd heart | 1st heart)
= (13/52) × (12/51) = 1/17 ≈ 5.9%즉, 연속으로 하트를 두 장 뽑을 확률은 5.9%이다.
예제 2: 온라인 쇼핑 (Online Purchases)
이제 비즈니스 사례를 살펴보자. 온라인 쇼핑몰에서 고객의 구매 패턴을 분석하는 데이터 전문가라고 가정해보자.
두 개의 사건:
- 고객이 100달러 이상을 지출하는 사건(A)
- 고객이 무료 기프트 카드를 받는 사건(B)
- 쇼핑몰 데이터에 따르면, 고객의 20%가 100달러 이상을 지출한다. → P(A) = 0.2
- 100달러 이상을 지출한 고객 중 10%가 랜덤으로 기프트 카드를 받는다. → P(B | A) = 0.1
이를 조건부 확률 공식에 대입하면:
P(100달러 이상 구매 그리고 기프트 카드 받기)
= P(100달러 이상 구매) × P(기프트 카드 받기 | 100달러 이상 구매)
= 0.2 × 0.1 = 0.02
= 2%즉, 고객이 100달러 이상을 지출하고 기프트 카드를 받을 확률은 2%이다.
핵심 정리 (Key Takeaways)
- 조건부 확률(Conditional Probability): 하나의 사건이 이미 발생했을 때, 다른 사건이 발생할 확률을 나타낸다.
- 종속적인 사건(Dependent Events): 첫 번째 사건이 두 번째 사건의 확률을 변화시키는 경우.
- 조건부 확률 공식:
- P(A and B) = P(A) × P(B | A)
- P(B | A) = P(A and B) / P(A)
- 비즈니스 및 데이터 분석 활용 사례:
- 머신러닝 모델에서 특정 데이터 패턴 예측
- 보험 업계에서 특정 위험 요소 평가
- 마케팅에서 광고 캠페인의 매출 영향 분석
참고자료:
'Machine Learning > Statistics' 카테고리의 다른 글
Expanded Bayes' Theorem: 확장된 베이즈 정리 (0) 2025.03.27 베이즈 정리: Bayes' Theorem (0) 2025.03.26 The Probability of Multiple Events: 다중 사건의 확률 (0) 2025.03.24 Fundamental Concepts of Probability: 확률의 기본 개념 (0) 2025.03.23 Objective vs Subjective Probability: 객관적 vs 주관적 확률 (2) 2025.03.22