Digunakan untuk mengelompokan sejumlah kasus yang besar lebih dari 200 kasus dengan lebih efisien. Metode ini berdasarkan nearest centroid sorting yaitu pengelompokan berdasarkan jarak terkecil antar kasus dan pusat dari klaster. Teknik ini membutuhkan jumlah klaster yang ditentukan terlebih dahulu oleh pemakai. Dan untuk hal tersebut dapat menggunakan analisis hirarki dalam menentukan jumlah klaster.
MacQueen (1967) membagi prosedur metode K-Means Clustering menjadi tiga tahap :
- Membagi individu (cases) menjadi k klaster awal.
- Proses dimulai dari menyusun individu (cases), masukan cases ke klaster yang memiliki pusat rata-rata terdekat. Ukuran jarak yang digunakan pada metode ini adalah Euclidean Distance. Hitung kembali pusat dari klaster yang menerima cases baru dan yang kehilangan cases.
- Ulangi langkah kedua sampai tidak ada lagi penempatan cases kedalam klaster.
Dengan metode K-Means individu dikelompokan menjadi k kelompok dengan cara memindah-mindahkan individu dari kelompok yang satu ke kelompok yang lain sehingga tercapai komponen kesalahan yang minimum
Tidak ada komentar:
Posting Komentar