Text
Analisis komparatif kinerja algoritma latent semantic indexing dan k-means dalam mengelompokan dokumen teks pendek
ANALISIS KOMPARATIF KINERJA ALGORITMA LATENT SEMANTIC
INDEXING DAN K-MEANS DALAM MENGELOMPOKAN DOKUMEN
TEKS PENDEK
FITRIANTO ADI SAPUTRO
ABSTRAK
Di era yang serba cepat ini, pertumbuhan data digital akan semakin cepat dan
akhirnya banyak penggunaan teks pendek dalam dunia digital, akibatnya dokumen
tersebut menjadi tidak terorganisir, terlebih lagi dokumen teks pendek biasanya
sulit di kelompokan karena sering menyebabkan ambiguitas. Kebutuhan analisis
teks sangat diperlukan dalam menangani masalah tersebut. Agar dokumen teks
pendek dapat terorganisir kembali maka diperlukan pengelompokan data dengan
cara text mining. Penelitian ini dilakukan di Jurusan Teknik Elektro Universitas
Negeri Jakarta dimulai dari bulan Mei 2015 hingga Desember 2015. Tujuan dari
penelitian ini adalah untuk mengetahui algoritma mana yang lebih baik antara LSI
dan K-means dalam melakukan pengelompokan dokumen teks pendek. Pengujian
dalam peneltian ini menggunakan metode eksperimen, data teks pendek yang
digunakan berasal dari tweets akun twitter @detik, yang diambil dari tanggal 7
Oktober 2015 hingga 21 Oktober 2015. Hasil dari pengolahan data kedua algoritma
akan dibandingkan tingkat akurasinya. Untuk menghitung akurasi algoritma
tersebut diperlukan perhitungan Confusion Matrix. Dari hasil pengujian,
menunjukkan bahwa dengan menggunakan K-Means Clustering akurasinya selalu
lebih tinggi dibandingkan LSI. Algoritma K-Means memiliki akurasi 49% hingga
51%, sedangkan LSI memiliki keakurasian antara 15% hingga 40%. Dan dapat
ditarik kesimpulan bahwa Algoritma K-Means lebih baik dari pada algoritma LSI
dalam pengelompokan dokumen teks pendek.
Kata kunci : LSI, K-means, Pengelompokan Teks , Dokumen Teks Pendek, Text
Mining
Bibliografi : lembar 80-81
SS00008014 | SK 8014 | UPT Perpustakaan UNJ (CD.05.2016.005) | Tersedia |
Tidak tersedia versi lain