개발학습일지

[AI] 머신러닝 Unsupervised _평균군집 K-Means Clustering 본문

AI/Machine Learning

[AI] 머신러닝 Unsupervised _평균군집 K-Means Clustering

처카푸 2024. 4. 15. 17:51

Unsupervised Learning 은 y(정답) 없이 인공지능을 학습 시키는 것 이다. (비지도 학습)

평균군집 K-Means는 

- 군집 중심점(centroid)라는 특정한 임의의 지점을 선택해 해당 중심에 가장 가까운 포인트들을 선택한다

- 군집 중심점은 서택된 포인트의 평군 지점으로 이동하고 이동된 중심점에서 다시 가까운 포인트를 선택한다

- 이 과정을 반복하다가 더 이상 중심점의 이동이 없으면 반복을 멈추고 해당 중심점에 속하는 포인트들을 군집화 한다

 

Choosing the right number of clusters

몇개로 분휴 할지는 어떻게 결정할까? K의 갯수를 정하는 방법

클러스팅이 잘 되었다 라는 것은 가까운 데이터끼리 잘 뭉쳐 있다는 것이다

센터가 원소들과의 거리가 멀수록 값이 커진다.

따라서 최소값에 가까워지는 갯수를 뽑되, 갯수가 너무 많아지면 차별성이 없어진다.