You are on page 1of 3

K-means merupakan salah satu algoritma clustering.

Tujuan algoritma ini yaitu untuk


membagi data menjadi beberapa kelompok. Algoritma ini menerima masukan berupa
data tanpa label kelas. Hal ini berbeda dengan supervised learning yang menerima
masukan berupa vektor (x1 , y1) , (x2 , y2) , , (xi , yi), di mana xi merupakan
data dari suatu data pelatihan dan yi merupakan label kelas untuk xi.

Pada algoritma pembelajaran ini, komputer mengelompokkan sendiri data-data yang


menjadi masukannya tanpa mengetahui terlebih dulu target kelasnya[1]. Pembelajaran
ini termasuk dalam unsupervised learning. Masukan yang diterima adalah data atau
objek dan k buah kelompok (cluster) yang diinginkan. Algoritma ini akan
mengelompokkan data atau objek ke dalam k buah kelompok tersebut. Pada setiap
cluster terdapat titik pusat (centroid) yang merepresentasikan cluster tersebut.
(Wikipedia)

Seperti yang saya kutip dari mbah wikipedia diatas, K-Means sering digunakan untuk
data mining. Algoritma ini bersifat asosiatif, yaitu mengelompokkan data yang hampir
mendekati dengan titik pusat atau centroid yang dijadikan sebagai jarak. Kata lainnya
algoritma K-Means melakukan pengelompokkan atau clustering berbasiskan jarak yang
membagi data ke dalam sejumlah kelompok atau cluster. Selain itu, algoritma ini hanya
dapat bekerja pada data yang berupa numerik/angka. Saya tidak akan menjelaskan
langkah-langkah algoritmanya, karena di internet dan blog lainnya sudah banyak yang
membahas secara lengkap. Disini saya cuma ingin membagikan contoh penerapan
aplikasinya ke dalam bahasa pemrograman php. berikut screenshotnya :

Data objek dan data cluster


Hasil Perhitungan manual Euclidian distance Algoritma K-Means
Hasil dalam bentuk Diagram dengan jpgraph scatter

K-means dapat digunakan untuk mengelompokkan data sebelum menerapkan teknik


analisis data lainnya, K-means dapat digunakan untuk terlebih dahulu
mengelompokkan data ke dalam cluster-cluster. Kemudian teknik analisis data hanya
perlu diterapkan pada centroid dari setiap cluster sehingga lebih efisien dalam hal
penggunaan waktu dan ruang. dan sekian dulu untuk artikel tentang Algoritma K-

means Clustering, mudah-mudahan artikel ini bermanfaat. CMIIW,..

You might also like