CD Skripsi
Peningkatan Akurasi Model Random Forest Dalam Customer Churn Prediction Menggunakan Smote Untuk Mengatasi Data Imbalance
ABSTRAK
MUHAMMAD REZKY SAPUTRA AMIN. Peningkatan Akurasi Model Random Forest dalam Customer Churn Prediction menggunakan SMOTE untuk Mengatasi Data Imbalance (dibimbing oleh Andi Yulia Muniar dan Fitriana M. Sabir).
Customer churn merupakan permasalahan penting bagi perusahaan pada industri kompetitif karena dapat menurunkan pendapatan dan memengaruhi keberlangsungan bisnis. Tantangan utama dalam membangun model prediksi churn adalah ketidakseimbangan data, di mana jumlah pelanggan bertahan jauh lebih banyak dibandingkan pelanggan yang berhenti, sehingga model cenderung bias pada kelas mayoritas. Penelitian ini bertujuan untuk meningkatkan akurasi prediksi churn dengan menggabungkan algoritma Random Forest dan Synthetic Minority Oversampling Technique (SMOTE). Data diperoleh melalui studi pustaka dan platform Kaggle dengan total 7.043 entri dan 20 atribut pelanggan. Hasil penelitian menunjukkan bahwa penerapan SMOTE pada Random Forest mampu meningkatkan sensitivitas model dalam mendeteksi churn, dan setelah dilakukan tuning serta optimasi threshold, model terbaik mencapai akurasi di atas 90% dengan peningkatan signifikan pada recall dan F1-score. Hal ini membuktikan bahwa kombinasi Random Forest, SMOTE, dan optimasi threshold efektif menghasilkan
prediksi churn yang lebih akurat serta dapat mendukung strategi retensi pelanggan.
Kata Kunci: Customer Churn, Random Forest, SMOTE, Threshold Optimization, Data Imbalance
Tidak tersedia versi lain