Tugas Akhir Sarjana
KLASIFIKASI KOMENTAR NEGATIF PADA MEDIA SOSIAL DENGAN MENGGUNAKAN METODE RANDOM FOREST
Jumlah pengguna internet di Indonesia hingga kuartal II/2020 mencapai 196,7 juta atau 73,7 persen dari populasi. Jumlah ini bertambah sekitar 25,5 juta pengguna dibandingkan tahun lalu. Dari data tersebut mayoritas menggunakan media sosial untuk berkomunikasi. Dampak positif dari media sosial adalah memudahkan pengguna untuk berinteraksi dengan orang banyak, menambah wawasan dan pengetahuan lewat media sosial, dan mendapatkan ruang untuk mengekspresikan diri. Sedangkan dampak negatif dari media sosial adalah maraknya pornografi, mudah menimbulkan konflik, menimbulkan kecanduan, banyaknya berita bohong atau hoax, dan media sosial juga dapat dijadikan wadah untuk dijadikan ajang ujaran kebencian terhadap individu dan organisasi. Penelitian ini melakukan klasifikasi terhadap komentar negatif pada media sosial dengan menggunakan Random Forest. Tahapan untuk melakukan klasifikasi dimulai dari pengumpulan data, preprocessing data, feature extraction menggunakan TF-IDF (Term Frequency – Inverse Document Frequency), modelling, dan evaluasi. Klasifikasi komentar negatif dibagi menjadi 4 class, yaitu Pornografi, SARA, Radikalisme, dan Pencemaran Nama Baik yang setiap class memiliki hyperparameter yang berbeda yang dipilih dengan menggunakan GridSearchCV. Rata-rata akurasi yang didapat sebesar 0,9376. Untuk evaluasi menggunakan cross validation, yaitu dengan memecah setiap dataset menjadi bagian-bagian dengan ukuran yang sama. Hasil evaluasi menunjukkan bahwa hasil model sudah baik.
Kata Kunci : komentar negatif, tf-idf, random forest, cross validation
Tidak tersedia versi lain