-
Feature Engineering (특징 엔지니어링) | Supervised Machine Learning: Regression and ClassificationMachine Learning/Stanford ML Specialization 2023. 11. 5. 13:58
모델을 만들 때, Feature를 잘 선정하는것 또한 중요한 일이다. 어떤 Feature를 어떻게 넣을지 계산하는 Feature Engineer의 직책이 있을 만큼, ML이 비지니스의 Core Mechanism 이라면, 정말 중요한 요소이다.
맨 처음, Linear Regression(선형 회귀)에 대해서 배울 때, 우리는 집의 크기(area)값을 사용했었다. 집의 Area가 아니라, frontage(정면값)과 depth(깊이)값을 알고 있다고 하자. 그러면 아래와 같은 모델을 예측해 볼 수 있다.
# x1 -> frontage # x2 -> depth f(x) = w1x1 + w2x2 + b
그런데 여기서, 집의 넓이 또한 계산해서 사용할 수 있다.
x3 = x1x2
그러면 아래와 같이, 1개의 feature가 추가된 모델을 생성해낼 수 있다.
# x1 -> frontage # x2 -> depth # x3 -> area: frontage * depth f(x) = w1x1 + w2x2 + w3x3 + b
이것이 바로 Feature Engineering인데, 직관을 이용해서 새로운 Feature를 만드는 것을 말하는데, 기존의 Features들을 변환하거나 결합해서 다른 feature를 생성하는 작업이다. 이러한 방식으로, 더 나은 모델을 얻을수도 있다.
https://youtu.be/ecOdZlY9jsQ Reference
'Machine Learning > Stanford ML Specialization' 카테고리의 다른 글