CD Skripsi
Implementasi Algoritma Roberta Untuk Deteksi Berita Hoax Berbahasa Indonesia Dengan Fine-Tuning Dataset lokal
ABSTRAK
ANDI MUHAMMAD FADJRIN ARIF. Implementasi Algoritma Roberta Untuk Deteksi Berita Hoax Berbahasa Indonesia Dengan Fine-Tuning Dataset Lokal (dibimbing oleh Nurzaenab dan A. Sumardin)
Penyebaran berita hoaks berbahasa Indonesia yang semakin marak di media daring menimbulkan kebutuhan akan sistem deteksi otomatis yang akurat. Solusi yang ditawarkan penelitian ini adalah penerapan model RoBERTa dengan fine-tuning hyperparameter menggunakan Optuna, serta analisis interpretatif hasil prediksi menggunakan LIME. Tujuan penelitian adalah membangun sistem deteksi berita hoaks yang akurat, stabil, dan dapat dijelaskan secara linguistik. Data penelitian diperoleh melalui studi pustaka dan 9.950 berita hasil web scraping dari TurnBackHoax.id (hoaks) dan Detik.com (valid. Metode penelitian yang digunakan adalah preprocessing teks, fine-tuning RoBERTa, optimasi hyperparameter dengan Optuna, evaluasi menggunakan confusion matrix dan metrik (akurasi, presisi, recall, F1-score, ROC-AUC), serta interpretasi model dengan LIME. Hasil penelitian menunjukkan bahwa RoBERTa fine-tuned mencapai akurasi 95,68%, F1-score 95,63%, dan ROC-AUC 99,11% dengan performa yang konsisten pada berbagai percobaan. Sistem ini dinyatakan efektif sebagai deteksi awal berita hoaks berbahasa Indonesia dan berpotensi diimplementasikan pada platform pemantauan berita.
Kata kunci: Bahasa Indonesia, Deteksi Hoaks, Fine-Tuning, LIME, Optuna, RoBERTa.
Tidak tersedia versi lain