[5주차 총정리] 최적 Cluster 개수 찾기 (elbow기법, silhouette기법)
1. 엘보우(Elbow) 기법 - SSE(Sum of Squared Errors)의 값이 점점 줄어들다가 어느 순간 줄어드는 비율이 급격하게 작아지는 부분이 생긴다. - 결과물인 그래프 모양을 보면 팔꿈치에 해당하는 바로 그 부분이 최적의 클러스터 개수가 된다. - 간단하고, 이해하기 쉬워 사람들이 많이 사용하는 기법 - Cluster 내 응집도만 고려하고, Cluster 간 분리도는 고려하지 않는다. - 보통, 엘보우 기법으로 그래프를 확인한 후, cluster의 개수를 2로 해야할지, 3으로 해야할지 헷갈리는 경우에 추가로 실루엣 기법을 사용한다. def elbow(X): total_distance = [] for i in range(1, 11): model = cluster.KMeans(n_clus..