Text
Analisis metode extending document term dengan algoritma K-Meas untuk meningkatkan hasil akurasi algoritma support vector machine pada klasifikasi dokumen teks pendek twitter
ANALISIS METODE EXTENDING DOCUMENT TERM DENGAN
ALGORITMA K-MEANS UNTUK MENINGKATKAN HASIL AKURASI
KLASIFIKASI ALGORITMA SUPPORT VECTOR MACHINE PADA
DOKUMEN TEKS PENDEK TWITTER
PANDU REYNALDO
ABSTRAK
Twitter adalah sebuah layanan microblogging yang memungkinkan orang untuk
berkomunikasi dengan singkat lewat pesan yang hanya berisikan 140 karakter.
Dengan batasan tersebut, twitter dapat dikategorikan sebagai dokumen teks
pendek. Terbatasnya jumlah kata yang ada pada sebuah tweet menyebabkan
sulitnya tweet tersebut untuk diklasifikasi. Penelitian ini menggunakan algoritma
klasifikasi Support Vector Machine, dan metode Extending Document Term
dengan algoritma K-Means untuk meningkatkan akurasi dari hasil klasifikasi.
Extending Document Term adalah sebuah metode untuk meningkatkan performa
algoritma pada klasifikasi teks pendek dengan cara memodifikasi isi dokumen
dengan menambahkan kata yang memiliki keterhubungan paling tinggi sesuai data
train. Hasil klasifikasi tiga tahap dalam penelitian ini dievaluasi tingkat
akurasinya menggunakan Confusion Matrix, dengan hasil akurasi dari algoritma
Support Vector Machine adalah 0.25, hasil akurasi Extending Document Term +
Support Vector Machine adalah 0.873 dan hasil akurasi K-Means + Extending
Document Term + Support Vector Machine adalah 0.815. Extending Document
Term + Support Vector Machine bisa mendapatkan hasil akurasi lebih baik
dibandingkan dengan K-Means + Extending Document Term + Support Vector
Machine. Hal ini disebabkan karena adanya pengelompokan menggunakan KMeans
sehingga pertemuan antar kata semakin sedikit, bank kata akan menjadi
lebih kecil dan terdapat beberapa data yang tidak mendapatkan Extending
Document Term karena berada di kelompok yang kurang tepat.
Kata Kunci : Twitter, Support Vector Machine, Extending Document Term, KMeans,
akurasi
Bibliografi : lembar 74-75
SS00009436 | SK 9436 | UPT Perpustakaan UNJ (CD.05.2016.007) | Tersedia |
Tidak tersedia versi lain