Clustering
-
[scikit-learn] Iris 데이터를 이용한 머신러닝_KmeansAI 2020. 2. 25. 15:49
비지도학습이란 ? 지도학습과는 다르게 데이터에 대한 정답, 즉 라벨을 사용하지 않고 모델을 만들 수 있다. k-평균 군집화(K-means Clustering) ? 주어진 데이터를 k개의 클러스터로 묶는 알고리즘 각 클러스터와 거리 차이의 분산을 최소화하는 방식으로 동작한다. k는 클러스터의 중심 수를 의미한다. Iris 데이터에 관한 전처리는 미리 되어 있다는 가정하에 사이킷런을 이용한 군집화를 진행한다. 사이킷런 라이브러리의 k-평균 군집화 함수 불러오기 from sklearn.cluster import KMeans k 값을 의미하는 군집의 개수를 설정하기 k_means = KMeans(n_clusters=3) n_clusters는 k값을 의미하는 것으로 군집의 개수를 뜻한다. train 데이터를 이용..