-
베이즈 정리: Bayes' TheoremMachine Learning/Statistics 2025. 3. 26. 19:00
이전에 조건부 확률(Conditional Probability)이란 어떤 사건이 이미 발생했을 때, 다른 사건이 발생할 확률이라는 것을 배웠다. 예를 들어, 트럼프 카드 덱에서 에이스를 한 장 뽑으면, 두 번째 에이스를 뽑을 확률이 변한다.
이번에는 베이즈 정리(Bayes' Theorem)를 사용하여 조건부 확률을 계산하는 방법을 배울 것이다. 베이즈 정리(Bayes' Rule)는 조건부 확률을 구하는 수학 공식으로, 18세기 영국의 수학자 토마스 베이즈(Thomas Bayes)의 이름을 따서 명명되었다. (아래 그림이 토마스 베이즈님이다)
https://www.the-tls.co.uk/regular-features/footnotes-to-plato/thomas-bayes-science-crisis 베이즈 정리란? (What is Bayes' Theorem?)
https://www.investopedia.com/terms/b/bayes-theorem.asp 베이즈 정리는 새로운 정보에 따라 사건의 확률을 업데이트하는 방법을 제공한다.
베이즈 통계에서는 사전 확률(Prior Probability)과 사후 확률(Posterior Probability)이라는 개념을 사용한다:
- 사전 확률(Prior Probability): 새로운 데이터가 수집되기 전에 사건이 발생할 확률
- 사후 확률(Posterior Probability): 새로운 데이터를 반영하여 업데이트된 확률
예제:
특정 질병이 연령대와 관련이 있다고 가정해 보자.
- 사전 확률: 일반적으로 한 사람이 이 질병을 가지고 있을 확률
- 사후 확률: 특정 연령대에 속할 때, 그 사람이 질병을 가지고 있을 확률 (새로운 데이터를 반영한 확률)
베이즈 정리는 머신러닝, 인공지능, 금융, 의료 분야 등에서 새로운 정보가 주어졌을 때 확률을 조정하는 강력한 도구로 사용된다.
- 금융: 대출 기관은 베이즈 분석을 사용하여 대출 신청자의 신용 위험을 평가한다.
- 온라인 쇼핑: 리테일러는 사용자의 구매 이력을 기반으로 특정 제품을 추천할 확률을 계산한다.
- 마케팅: 고객 리뷰에서 긍정적 또는 부정적 피드백을 분류하는 데 사용된다.
베이즈 정리 공식 (Bayes' Theorem Formula)
베이즈 정리는 다음과 같이 표현된다:
P(A | B) = (P(A) × P(B | A)) / P(B)
- P(A): 사건 A가 발생할 확률 (사전 확률)
- P(B | A): 사건 A가 발생했을 때 사건 B가 발생할 확률
- P(B): 사건 B가 발생할 확률
- P(A | B): 사건 B가 발생했을 때 사건 A가 발생할 확률 (사후 확률)
베이즈 정리는 B가 주어졌을 때 A가 발생할 확률을 계산하는데 유용하다.
예제 1: 날씨 예측 (Weather Prediction)
베이즈 정리를 사용하여 날씨를 예측하는 예제를 살펴보자.
문제 상황:
- 중요한 야외 행사가 예정되어 있다.
- 아침에 날씨가 흐린 경우, 비가 올 가능성이 더 높다고 생각된다.
- 목표: "아침이 흐릴 때, 비가 올 확률을 계산하기"
주어진 정보:
- 특정 계절에서 비가 올 확률 = 10% (P(비))
- 흐린 날의 확률 = 40% (P(흐림))
- 비 오는 날 중 흐린 날의 확률 = 50% (P(흐림 | 비))
이를 베이즈 정리 공식에 대입하면:
P(비 | 흐림)
= (P(비) × P(흐림 | 비)) / P(흐림)
= (0.1 × 0.5) / 0.4
= 0.125 (12.5%)즉, 아침에 흐리면 비가 올 확률은 12.5%로 업데이트된다. 비가 올 확률이 낮으므로, 야외 행사를 그대로 진행할 수 있다.
핵심 정리 (Key Takeaways)
- 베이즈 정리(Bayes' Theorem): 새로운 정보를 반영하여 확률을 업데이트하는 수학적 공식
- 사전 확률(Prior Probability): 새로운 데이터를 반영하기 전의 확률
- 사후 확률(Posterior Probability): 새로운 정보를 반영한 후의 업데이트된 확률
- 공식: P(A | B) = (P(A) × P(B | A)) / P(B)
- 활용 사례:
- 금융: 신용 위험 평가
- 온라인 쇼핑: 추천 시스템
- 의료: 질병 진단 확률 분석
- 마케팅: 고객 피드백 분석
베이즈 정리는 현대 데이터 분석과 인공지능에서 매우 중요한 역할을 하며, 새롭게 주어진 데이터를 바탕으로 보다 정밀한 의사 결정을 할 수 있도록 도와준다.
'Machine Learning > Statistics' 카테고리의 다른 글
Probability Distribution: 확률 분포 (2) 2025.03.28 Expanded Bayes' Theorem: 확장된 베이즈 정리 (0) 2025.03.27 Conditional Probability: 조건부 확률 (3) 2025.03.25 The Probability of Multiple Events: 다중 사건의 확률 (0) 2025.03.24 Fundamental Concepts of Probability: 확률의 기본 개념 (0) 2025.03.23