-
Supervised Learning (지도학습) | Supervised Machine Learning: Regression and ClassificationMachine Learning/Stanford ML Specialization 2023. 10. 11. 20:09
머신러닝을 이용해서 앱을 만든다고 생각해보자. 머신러닝은 결국 함수이다. 함수에는 Input과 Output이 필요하다. 어떤 인풋으로 어떤 아웃풋을 만들어내서 어떤 어플리케이션을 만들 수 있을까?
Input Output Application Email 스팸 이메일인가? (True/False) 스팸 필터링 Audio 번역 음성 인식 영어 스페인어 번역 광고, 유저 정보 Click 했는가? (True/False) 온라인 광고 이미지, 레이더 정보 다른 차들의 위치 자율주행 핸드폰 이미지 고장났는가? (True/False) 육안 검사(제품 결함등에 사용) 위와같이 우리가 이미 갖고있는 데이터를 학습시켜서 이전과 같은 결과를 추측할 수 있도록 해주는것이 지도학습이다. 이 이외에도 제일 많이 예시로 드는것이 Housing price prediction이다. 집의 사이즈와 가격 정보를 갖고 있다면, 그 정보를 학습해서 현재 집값을 예측할 수 있다. 그렇게 모델을 학습시킨다면, 이것 역시 Supervised Learning(지도학습)을 이용한 머신러닝이다. 이것을 회귀분석(Regression)이라고 한다.
하지만 집값과 같이 값을 예측하는것이 아니라, 스팸 이메일인지, 핸드폰이 고장 났는지, 또는 사이즈를 이용해 암인지 아닌지 예측할 때는 Classification(분류)를 이용한다. 이 경우, 악성인지 아닌지 (1 or 0) 두가지중 하나의 Output을 갖게 된다. 사이즈의 데이터만 갖고 암을 예측할 수 있다면 좋겠지만, 세상은 간단하지 않다. 더 많은 정보가 주어지면, 예측하기 쉬워진다. 종양의 크기와 환자의 나이 정보를 주었을 때, 훨씬 예측률이 올라간다. 즉, 환자의 나이, 종양의 크기를 이용해 악성인지 아닌지 분류(Classification)하는 방법이라고 할 수 있다.
종합해보면,
- Supervised Learning(지도학습)은 모델이 "right answers(정답)"을 통해 학습하는것이다.
- Supervised Learning(지도학습) 에는 Regression(회귀)학습과 Classification(분류)학습이 있다.
- Regression(회귀) 학습은 숫자를 예측하는것인데, infinite하게 수많은 outputs이 존재한다.
- Classification(분류) 학습은 카테고리를 예측하는것인데, 아웃풋의 수는 회귀에 비해 적은 숫자이다.
Reference
'Machine Learning > Stanford ML Specialization' 카테고리의 다른 글