Tugas Akhir Sarjana
PENERAPAN TF-IDF VECTORIZER DAN RANDOM FOREST UNTUK ANALISIS FEATURE IMPORTANCE DALAM PREDIKSI PUTUSAN PENGADILAN PAJAK
Pada tahun 2022, Laporan Hasil Kinerja Direktorat Jenderal Pajak (DJP) menemukan bahwa presentase kemenangan di Pengadilan Pajak terkait banding dan gugatan hanya mencapai 44,80%. DJP menganalisa bahwa adanya kebutuhan dalam optimalisasi dukungan dokumen atau sumber data. Model berbasis machine learning dapat dikembangkan untuk memprediksi probabilitas kemenangan DJP di tingkat pengadilan pajak. Penelitian ini menerapkan metode random forest dan teknik vektorisasi TF-IDF (Term Frequency-Inverse Document Frequency) untuk membangun model. Dataset yang digunakan terdiri dari delapan fitur numerik dan dua fitur hasil vektorisasi TF-IDF, yaitu pendapat Wajib Pajak dan pendapat fiskus. Model random forest yang dibangun dengan parameter terbaik menghasilkan akurasi sebesar 86% pada data uji. Analisis feature importance menggunakan gini importance menunjukkan bahwa pendapat Wajib Pajak memiliki pengaruh terbesar dalam menentukan putusan pengadilan. Selain itu, penelitian ini juga menghasilkan aplikasi berbasis web dengan aplikasi streamlit untuk implementasi model prediktif yang telah dikembangkan.
Kata kunci: Pengadilan Pajak, Random Forest, Tf-Idf Vectorizer
Tidak tersedia versi lain