Conditional Probability: 조건부 확률

Machine Learning/Statistics 2025. 3. 25. 19:00

조건부 확률이란? (What is Conditional Probability?)

지금까지 단일 사건과 두 개 이상의 독립적인 사건(Independent Events)에 대한 확률을 계산하는 방법을 배웠다. 독립적인 사건이란 한 사건이 발생해도 다른 사건의 결과에 영향을 주지 않는 경우를 의미한다. 예를 들어, 두 번의 동전 던지기는 독립적인 사건이다. 첫 번째 던지기의 결과가 두 번째 던지기의 결과에 영향을 주지 않기 때문이다.

이전 글 참고:

https://g471000.tistory.com/244

https://g471000.tistory.com/245

이번에는 종속적인 사건(Dependent Events)에 대한 확률을 계산하는 방법을 배운다. 조건부 확률(Conditional Probability)은 한 사건이 이미 발생했을 때, 다른 사건이 발생할 확률을 의미한다.

조건부 확률은 금융, 보험, 과학, 머신러닝 등 다양한 분야에서 활용된다. 예를 들어:

생명보험 회사는 특정 직업(예: 스카이다이빙 강사)을 가진 사람을 보험에 가입시킬 위험성을 평가하기 위해 조건부 확률을 사용한다.
머신러닝 모델을 개발하는 데이터 전문가는 조건부 확률을 활용하여 복잡한 데이터 세트에서 정확한 예측을 수행한다.

이제 조건부 확률을 계산하는 방법을 살펴보자.

조건부 확률과 종속적인 사건 (Conditional Probability and Dependent Events)

두 개의 사건이 독립적(Independent)이라면, 첫 번째 사건이 발생해도 두 번째 사건의 확률에 영향을 주지 않는다. 하지만 종속적인 사건(Dependent Events)의 경우, 첫 번째 사건이 두 번째 사건의 확률을 변화시킨다.

예를 들어:

웹사이트 방문은 인터넷 연결이 필요하다. 즉, 인터넷 연결이 되어 있어야 웹사이트를 방문할 수 있다.
해외여행을 하려면 여권이 필요하다. 여권이 있어야 해외여행이 가능하다.
트럼프 카드에서 에이스를 뽑은 후 또 다른 에이스를 뽑을 확률은 첫 번째 카드 뽑기 결과에 의해 달라진다.

예제: 트럼프 카드 덱에서 두 장의 에이스를 연속으로 뽑는 경우

52장의 카드 중 에이스는 4장이다. 따라서 첫 번째로 에이스를 뽑을 확률은 4/52 (7.8%)이다.
첫 번째 에이스가 제거된 후 남은 카드 수는 51장이며, 에이스는 3장 남아 있다. 따라서 두 번째로 에이스를 뽑을 확률은 3/51 (5.8%)이다.
두 사건이 종속적이므로, 두 번 연속으로 에이스를 뽑을 확률은 (4/52) × (3/51) = 1/221 ≈ 0.5%이다.

이제 조건부 확률을 계산하는 공식에 대해 살펴보자.

조건부 확률 공식 (Formula for Conditional Probability)

두 개의 종속적인 사건 A와 B가 있을 때, A와 B가 모두 발생할 확률은 다음과 같이 계산된다:

P(A and B) = P(A) × P(B | A)

여기서 P(B | A)는 A가 발생했을 때 B가 발생할 확률을 의미하며, 기호 |는 "A가 발생했을 때 B의 확률"을 나타낸다.

또한, 공식은 다음과 같이 변형될 수도 있다:

P(B | A) = P(A and B) / P(A)

이 두 가지 방식은 같은 의미를 가지며, 주어진 정보에 따라 더 적절한 방법을 선택할 수 있다.

참고: 독립적인 사건의 경우 P(B | A) = P(B)가 성립하므로, 공식을 변형하면 P(A and B) = P(A) × P(B)가 된다. 이는 앞에서 배운 곱셈 규칙(Multiplication Rule)과 동일하다.

예제 1: 트럼프 카드 뽑기 (Playing Cards)

조건부 확률의 개념을 적용하기 위해, 52장의 표준 트럼프 카드 덱을 사용한 예제를 살펴보자.

두 개의 사건:

첫 번째 카드에서 하트를 뽑는 사건(A)
두 번째 카드에서 다시 하트를 뽑는 사건(B)

첫 번째 사건 A에서 하트를 뽑을 확률:

한 덱에는 4가지 무늬(하트, 다이아몬드, 스페이드, 클럽)가 있으며, 각 무늬당 13장의 카드가 있다.
따라서 첫 번째 뽑기에서 하트를 뽑을 확률은 13/52 = 25%이다.

첫 번째 카드가 하트였을 경우, 두 번째 카드에서 하트를 뽑을 확률(B | A):

첫 번째 카드가 제거되었으므로, 덱에는 이제 51장이 남아 있고, 하트는 12장 남아 있다.
따라서 두 번째 뽑기에서 하트를 뽑을 확률은 12/51 = 23.5%이다.

이를 조건부 확률 공식에 대입하면:

P(1st heart and 2nd heart) = P(1st heart) × P(2nd heart | 1st heart)
= (13/52) × (12/51) = 1/17 ≈ 5.9%

즉, 연속으로 하트를 두 장 뽑을 확률은 5.9%이다.

예제 2: 온라인 쇼핑 (Online Purchases)

이제 비즈니스 사례를 살펴보자. 온라인 쇼핑몰에서 고객의 구매 패턴을 분석하는 데이터 전문가라고 가정해보자.

두 개의 사건:

고객이 100달러 이상을 지출하는 사건(A)
고객이 무료 기프트 카드를 받는 사건(B)

쇼핑몰 데이터에 따르면, 고객의 20%가 100달러 이상을 지출한다. → P(A) = 0.2
100달러 이상을 지출한 고객 중 10%가 랜덤으로 기프트 카드를 받는다. → P(B | A) = 0.1

이를 조건부 확률 공식에 대입하면:

P(100달러 이상 구매 그리고 기프트 카드 받기)
= P(100달러 이상 구매) × P(기프트 카드 받기 | 100달러 이상 구매)
= 0.2 × 0.1 = 0.02
= 2%

즉, 고객이 100달러 이상을 지출하고 기프트 카드를 받을 확률은 2%이다.

핵심 정리 (Key Takeaways)

조건부 확률(Conditional Probability): 하나의 사건이 이미 발생했을 때, 다른 사건이 발생할 확률을 나타낸다.
종속적인 사건(Dependent Events): 첫 번째 사건이 두 번째 사건의 확률을 변화시키는 경우.
조건부 확률 공식:
- P(A and B) = P(A) × P(B | A)
- P(B | A) = P(A and B) / P(A)
비즈니스 및 데이터 분석 활용 사례:
- 머신러닝 모델에서 특정 데이터 패턴 예측
- 보험 업계에서 특정 위험 요소 평가
- 마케팅에서 광고 캠페인의 매출 영향 분석

참고자료:

Conditional Probability에 대한 INVESTOPEDIA의 글

'Machine Learning > Statistics' 카테고리의 다른 글

Expanded Bayes' Theorem: 확장된 베이즈 정리 (0)	2025.03.27
베이즈 정리: Bayes' Theorem (0)	2025.03.26
The Probability of Multiple Events: 다중 사건의 확률 (0)	2025.03.24
Fundamental Concepts of Probability: 확률의 기본 개념 (0)	2025.03.23
Objective vs Subjective Probability: 객관적 vs 주관적 확률 (2)	2025.03.22

ABOUT ME

G471000 G471000

조건부 확률이란? (What is Conditional Probability?)

이전 글 참고:

조건부 확률과 종속적인 사건 (Conditional Probability and Dependent Events)

예제: 트럼프 카드 덱에서 두 장의 에이스를 연속으로 뽑는 경우

조건부 확률 공식 (Formula for Conditional Probability)

예제 1: 트럼프 카드 뽑기 (Playing Cards)

예제 2: 온라인 쇼핑 (Online Purchases)

핵심 정리 (Key Takeaways)

참고자료:

'Machine Learning > Statistics' 카테고리의 다른 글

티스토리툴바

ABOUT ME

조건부 확률이란? (What is Conditional Probability?)

이전 글 참고:

조건부 확률과 종속적인 사건 (Conditional Probability and Dependent Events)

예제: 트럼프 카드 덱에서 두 장의 에이스를 연속으로 뽑는 경우

조건부 확률 공식 (Formula for Conditional Probability)

예제 1: 트럼프 카드 뽑기 (Playing Cards)

예제 2: 온라인 쇼핑 (Online Purchases)

핵심 정리 (Key Takeaways)

참고자료:

'Machine Learning > Statistics' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바