Text
Performa algoritma K-Means untuk clustering pada dokumen pendek dengan centroid yang bervariasi
PERFORMA ALGORITMA K-MEANS UNTUK CLUSTERING
PADA DOKUMEN PENDEK DENGAN CENTROID YANG BERVARIASI
MONICA DEWI RATNASARI
ABSTRAK
Penelitian ini bertujuan untuk mengetahui performa algoritma K-Means untuk clustering (mengelompokkan) dokumen teks pendek. Penelitian dilakukan di Jurusan Elektro Universitas Negeri Jakarta pada semester genap (102) tahun ajaran 2014/2015 menggunakan metode eksperimen dengan teknik pengumpulan data dokumentasi dan angket. Pengelompokkan dokumen teks pendek dengan K-Means dalam penelitian ini terdiri dari tahap pra-proses, proses, dan analisa hasil dengan Confusion Matrix. Tahap pra-proses yaitu mencari bobot setiap dokumen yang nantinya akan digunakan sebagai data dalam clustering dengan algoritma K-Means. Tahap proses adalah melakukan clustering dengan algoritma K-Means. Pada tahap ini akan menghasilkan beberapa cluster yang jumlah anggota dari setiap cluster berbeda. Setiap cluster kemudian di analisis dengan Confusion Matrix antara data hasil clustering dengan algoritma K-Means dengan data hasil angket justifikasi. Hasil penelitian tingkat akurasi clustering paragraf kedua pada dua cluster adalah sebesar 58%, empat cluster adalah sebesar 28%, dan sebelas cluster adalah sebesar 18,50%. Sedangkan tingkat akurasi clustering seluruh abstrak pada dua cluster adalah sebesar 56%, empat cluster adalah sebesar 35%, dan sebelas cluster adalah sebesar 22,50%. Sehingga kesimpulan dari penelitian ini adalah bahwa semakin sedikit jumlah cluster yang di clustering, tingkat akurasi cluster akan semakin tinggi, dalam kasus pengelompokan dokumen yang jumlah anggota setiap kelompoknya tidak merata (heterogen).
Kata kunci : clustering, K-Means, dokumen teks pendek Bibliografi : lembar 78-79
SS00007886 | SK 7886 | UPT Perpustakaan UNJ (CD.05.2015.002) | Tersedia |
Tidak tersedia versi lain