Multiple Features

Machine Learning/Stanford ML Specialization 2023. 10. 28. 14:27

이전까지 Linear Regression을 살펴볼 때, 우리는 아래와 같이 1가지의 feature만 가지고 모델을 구현하는 방법에 대해 알아보았다.

$ f(x) = wx + b $

하지만, 실제 상황은 이렇지 않다. 집값을 예측할 때, 집의 크기 이외에도 방의 갯수, 층의 갯수, 연식, 주변 인구들의 연봉등의 정보들은 모두 집값을 예측하는데 도움을 준다. 이 정보들을 숫자로 나타내면 어떨까?

이런 feature들을 모두 수식에 표현하기 위해서, 수식에 쓰는 값들을 x1, x2등으로 표현하고, n은 feature의 갯수, i는 트레이닝이 몇번째를 나타내도록 규칙을 정했다. 예를들어 2번째 트레이닝을 예로 들면, 아래와 같은 벡터가 생성되게 된다.

$ [1416, 3, 2, 40] $

또한, 위 이미지 아래쪽에서 설명한것처럼, 2번째 트레이닝에서 3번째 feature 를 아래와 같이 나타낸다. 이는 1416 사이즈의 집, 즉 두번째 예시에서 세번째 feature, 즉, Number of floors(층의 갯수)를 나타내고, 주어진 데이터는 2이다.

이렇게 feature가 많아진다면? 모델은 당연히 복잡해지자. 기존 wx + b 일때는 x, 즉 집의 전체 사이즈만 생각했다면, 아래 예시를 보자.

집 전체 사이즈 뿐만 아니라, 방 갯수, 층수, 연식, 그리고 base price(는 b로 동일하다)까지 계산하는 복잡한 수식이 생성되었다. 예시로 각 w1, w2, w3, w4값을 모두 찾아내서 조금 더 정확한 예측을 할 수 있는 모델이 생성되었다.

이 수식을 조금더 수학적으로, 단순하게 나타낼 수 있는데, 바로 벡터를 이용하면 된다.

위에 예시처럼, w값들과 x값들을 모두 벡터로 생성한 후, dot product를 이용해서 w vector 와 v vector의 모든 곱의 합에 b값을 더한 수식을 위와같은 방식으로도 쓸 수 있다.

Gradient descent for multiple linear regression (다중 선형회귀의 경사 하강법) \| Supervised Machine Learning: Regression and Classification (0)	2023.10.30
Vectorization (벡터화) \| Supervised Machine Learning: Regression and Classification (0)	2023.10.28
Running Gradient Descent \| Supervised Machine Learning: Regression and Classification (0)	2023.10.27
Gradient Descent for Linear Regression (선형회귀를 위한 경사 하강법) \| Supervised Machine Learning: Regression and Classification (0)	2023.10.27
Learning Rate (학습률, 알파) \| Supervised Machine Learning: Regression and Classification (0)	2023.10.27

G471000 G471000