scatter_matrix
-
ML Intro | Iris Analysis - Look at your DataMachine Learning/ML with Python Library 2024. 1. 27. 18:34
먼저, 데이터가 어떤 패턴을 보여주고 있는지 살펴보았다. 데이터를 보고 SQL 쿼리를 돌리기 전에, 데이터를 시각화해서 보는 방법은 아주 효과적이다. 하지만 모든 데이터를 시각화만 가지고 판단할수는 없으니, 시각화만으로 섣불리 판단을 내리는것은 위험성이 있다. Scatter Plot을 이용하면, 각 데이터가 어떤 형태로 뭉쳐있는지, 펼쳐져 있는지, 그룹화가 되어있는지 쉽게 볼 수 있다. 4개의 특성에 대한 산점도 행렬을 시각화 해보도록 하자. 테이터의 색깔은 iris의 품종에 따라 구분한다. 이 그래프를 그리려면, 먼저 NumPy 배열을 pandas의 DataFrame으로 변경해야 한다. pandas에서는 산점도 행렬을 그려주는 scatter_matrix함수를 제공한다. 아래 코드를 이용하면 시각화를 할..