Skripsi
Deteksi E-mail Spam Menggunakan K-nearest Neighbour Pada E-email Berbahasa Indonesia
Spam merupakan istilah umum untuk menyebut e-mail komersial maupun non komersial yang tidak diinginkan. Kehadiran e-mail spam ini selain membuang waktu user untuk membaca dan menghapusnya, juga mengakibatkan melonjaknya pemakaian network bandwith dan mengurangi kapasitas penyimpanan email.
Penelitian ini bertujuan untuk membuat aplikasi sistem deteksi spam berbahasa Indonesia yang akurat yang dapat membantu pemilik akun memfilter spam berbahasa Indonesia secara otomatis.
Data ini diperoleh melalui (1) Studi Pustaka (2) Pengumpulan data email spam dari folderspam akun pribadi. Data analisis menggunakan script pemrograman PHP dan data MySQL.
Hasil pengujian sistem ini untuk k=3 adalah baik, dengan jumlah data latih 50 email spam dan 50 email non spam didapatkan rata-rata nilai akurasi sebesar 0,98, nilai precision sebesar 0,96 dan nilai recall sebesar 0,97. Pengujian dilakukan dengan ten fold cross validation yaitu teknik menilai keakuratan sebuah model yang dibangun berdasarkan dataset tertentu. Adapun keakuratan hasil klasifikasi dipengaruhi oleh nilai K dan jumlah data latih.
Tidak tersedia versi lain