-
Polynomial Regression (다항 회귀) | Supervised Machine Learning: Regression and ClassificationMachine Learning/Stanford ML Specialization 2023. 11. 5. 16:17
이때까지는 직선으로 이루어진 모델을 예측하는 Linear Regression(선형 회귀)에 대해서 알아보았는데, 이번에는 곡선을 피팅할 수 있는 다항식 회귀라는 새로운 알고리즘에 대해서 배운다.
만약 집값과 집의 크기가 항상 일정한 비율로 증가한다면, Linear Regression으로도 충분하겠지만, 현실은 그렇지 않다. 집의 크기가 어느정도 커지면, 가격의 변동이 주춤하기도 하고, 어떨때는 작은 사이즈 차이인데도 가격의 폭이 클때도 있기 떄문이다. 그런 경우를 생각했을 때, 예측률을 더 높이기 위해서, 직선이 아닌 곡선을 이용해서 계산해볼 수 있고, 이를 Polynomial Regression이라고 한다.
https://youtu.be/IFkRKJ5iBDE 위 예시를 보면, 2차방정식으로 곡선을 그렸을 때, 대부분의 값들에 가깝게 선(예측값들)을 그려내는 모델을 생성할 수 있다. 하지만, 집값이라는 것은, 대부분 집의 크기가 커지면 가격도 높아지기 때문에, 어느정도 크기 이상이 되었을 때, 작아지는 일은 없다. 하지만 이차 방정식은 (여기서는 위로 솟은 그래프이다) 최대값 이후부터는 다시, 분명히 내려오기 때문에 모델의 목표와 맞지 않다. 그렇기 때문에 한번 더, 기울기 방향의 변화가 있는 3차 방정식을 이용하게 되면, 사이즈가 큰 집들도 조금 더 정확하게 예측할 수 있다. 예시에서 나와 있듯, 집의 크기가 1에서 1000이라고 할 때, 2제곱, 3제곱을 이용하게 되면, 1 - 100,000 값들의 변화, 1 - 100,000,000 값들의 변화를 이용해 더 면밀한 계산을 할 수 있다. 또다른 방법은 root를 이용하는 방법이다. x에 루트를 씌우게 되면, 아래처럼 곡선이 다시 내려가지 않지만, 기울기가 조금 수평에 가까워 지는 그림을 그린다.
https://youtu.be/IFkRKJ5iBDE Reference
'Machine Learning > Stanford ML Specialization' 카테고리의 다른 글