出版社:Lembaga Penelitian dan Pengabdian kepada Masyarakat
摘要:Kota Kediri yang memiliki sistem layanan pengaduan masyarakat yang bernama Suara Warga (SURGA) Kota Kediri. Dalam penerimaan aduan, terkadang aduan yang masuk ke dalam sistem memiliki kemiripan dengan aduan yang sudah ada. Hal ini dikarenakan adanya kemungkinan pengadu mengirimkan aduan berulang kali atau beberapa pengadu mengirimkan aduan dengan isi yang sama.Manhattan similarity adalah algoritma yang digunakan untuk mendeteksi kemiripan dua dokumen. Manhattan similarity dapat diimplementasikan pada aduan yang masuk ke dalam sistem. Aduan yang masuk diproses dengan pendekatan text similarity, yaitu text processing dan dimodelkan dalam bentuk vector space model sehingga dapat dihitung jarak antar aduan menggunakan Manhattan distance. Perhitungan jarak antar aduan dibatasi dengan penyusunan cluster menggunakan K-Means clustering, sehingga hanya aduan yang berada pada cluster atau klasifikasi yang sama yang dibandingkan. Setelah klasifikasi dan deteksi dilakukan, sejumlah aduan diambil dari setiap cluster dan ditanyakan kepada 15 responden. Hasil uji coba menunjukkan bahwa aduan dapat dideteksi kemiripannya dengan jarak Manhattan distance minimal 0,9993 antar aduan dengan tingkat akurasi untuk aduan tidak mirip 100% dan untuk aduan mirip 90%. Waktu total yang dibutuhkan untuk melakukan proses klasifikasi dan deteksi kemiripan teks adalah 17 menit 27 detik dengan jumlah aduan 387.
关键词:K-Means Clustering;Manhattan Distance;Manhattan Similarity;Text Processing;TF-IDF;Vector Space Model