데이터과학
-
The Probability of Multiple Events: 다중 사건의 확률Machine Learning/Statistics 2025. 3. 24. 19:00
지금까지 단일 사건의 확률을 계산하는 방법을 배웠다. 이전글 참고https://g471000.tistory.com/243https://g471000.tistory.com/244 하지만 현실 세계와 데이터 분석에서는 여러 개의 사건이 동시에 발생하는 경우가 많다. 데이터 전문가로서 여러 사건의 확률을 다룰 일이 많을 것이다. 이번 글에서는 세 가지 기본 확률 규칙, 즉 여사건 규칙(Complement Rule), 덧셈 규칙(Addition Rule), 곱셈 규칙(Multiplication Rule)을 배울 것이다. 또한 서로 배타적인 사건(Mutually Exclusive Events)과 독립적인 사건(Independent Events)의 차이를 이해하고 각각의 확률을 계산하는 방법을 알아보겠다. 두 가..
-
Fundamental Concepts of Probability: 확률의 기본 개념Machine Learning/Statistics 2025. 3. 23. 19:00
최근에 확률이 수학을 사용하여 불확실성을 정량화하거나 어떤 일이 발생할 가능성을 설명하는 데 활용된다는 것을 배웠다. 예를 들어, 내일 비가 올 확률이 80%라든가, 특정 후보가 선거에서 승리할 확률이 20%라는 식으로 표현할 수 있다.https://g471000.tistory.com/243 이번 글에서는 확률의 기본 개념에 대해 자세히 알아보겠다. 무작위 실험의 개념, 사건의 확률을 표현하고 계산하는 방법, 그리고 기본적인 확률 표기법에 대해 논의할 것이다. 확률의 기초 개념확률 이론의 기초가 되는 세 가지 개념을 먼저 살펴보자:무작위 실험 (Random Experiment)결과 (Outcome)사건 (Event)확률은 통계학에서 무작위 실험(또는 통계 실험)이라고 부르는 개념을 다룬다. 무작위 실험..
-
Measures of position: 위치 측정값 - 백분위수와 사분위수Machine Learning/Statistics 2025. 3. 21. 19:00
지금까지 평균과 중앙값과 같은 중심 경향 측정값을 사용하여 데이터의 중심을 설명하는 방법을 배웠다. 또한 표준 편차와 같은 산포도를 사용하여 데이터의 분포를 나타내는 방법도 살펴보았다. 이러한 도구들은 데이터를 탐색하고 이해하는 데 유용하다. 지난글들: https://g471000.tistory.com/238https://g471000.tistory.com/239https://g471000.tistory.com/240https://g471000.tistory.com/241 이제 위치 측정값을 살펴보면서 기술 통계학의 개념을 완성해 보겠다.위치 측정값은 특정 값이 데이터셋 내에서 다른 값들과 비교하여 어느 위치에 있는지를 결정하는 데 도움이 된다. 중심 경향과 분포도를 함께 고려할 때, 개별 값들의 상..
-
Descriptive Statistics vs Inferential Statistics: 기술 통계와 추론 통계의 차이점Machine Learning/Statistics 2025. 3. 18. 19:56
이제 통계와 데이터 과학의 역할에 대해 더 깊이 이해했으니, 두 가지 주요 통계 방법인 기술 통계와 추론 통계에 대해 알아보자. 데이터 전문가는 각 방법을 활용해 서로 다른 인사이트를 얻는다. 이번 글에서는 기술 통계와 추론 통계의 차이점, 그리고 데이터 전문가들이 이를 활용하는 방법에 대해 살펴본다. 기술 통계 (Descriptive Statistics)기술 통계는 데이터의 주요 특징을 요약하고 설명하는 데 사용된다. 이는 많은 양의 데이터를 빠르게 이해하는 데 유용하다. 예를 들어, 1,000만 명의 신장 데이터를 보유하고 있다고 가정해보자. 모든 데이터를 직접 살펴보는 것은 어렵고, 설령 가능하더라도 해석하는 것이 쉽지 않다. 하지만 데이터를 요약하면 즉시 의미 있는 정보를 얻을 수 있다. 예를 ..
-
A/B testing: 데이터 기반 의사결정과 A/B 테스트의 중요성Machine Learning/Statistics 2025. 3. 17. 18:51
현대 경제에서 데이터는 가장 중요한 자산 중 하나다. 기업의 성공 여부는 데이터를 얼마나 효과적으로 활용하는지에 달려 있으며, 이를 위해 데이터 기반 의사결정이 필수적이다. 데이터를 분석하고 인사이트를 제공하는 데이터 전문가는 기업의 성장과 혁신을 이끄는 중요한 역할을 한다. 이 글에서는 A/B 테스트라는 강력한 데이터 분석 기법과 이를 활용하는 방법에 대해 알아본다. A/B 테스트란?A/B 테스트는 두 가지 버전(A와 B)의 요소를 비교하여 어느 것이 더 나은 성과를 보이는지 평가하는 실험 방법이다. 웹사이트 디자인, 모바일 앱, 온라인 광고, 마케팅 이메일 등 다양한 분야에서 활용된다. 예를 들어, 기업은 웹페이지의 두 가지 버전을 제작하여 어떤 디자인이 더 많은 클릭, 구매 또는 구독을 유도하는지 ..