Female Daily Network perusahaan yang bergerak di bidang media sosial. Female Dailymemiliki media sosial untuk membagikan pengalaman menggunakan produk kecantikanbernama Female Daily. Female Daily memiliki peraturan untuk tidak menggunakanFemale Daily Platform untuk mempromosikan, menjual produk, dan layanan di platformmedia sosial di Female Daily. Namun, pengguna di Female Daily terkadang melanggarperaturan tersebut di post mereka dan menyebabkan pengguna lain terganggu akan haltersebut. Admin di Female Daily kesulitan untuk mengidentifikasi pengguna yangmelanggar aturan itu dan melarang post mereka yang berisi penjualan produk karenaketerbatasan jumlah admin dengan jumlah post yang masuk tiap hari. Text mining jugadapat mengatasi permasalahan ini dengan menentukan klasifikasi secara otomatis denganmembuat sistem yang melakukan proses pembelajaran dengan dari kata-kata post yangtersedia. Algoritme yang bisa digunakan untuk melakukan proses text mining padapenelitian ini seperti Support Vector Machine (SVM), Naïve Bayes (NB), Decision Tree(DT), dan Random Forest (RF). Penelitian ini menggunakan kombinasi cara ekstraksifitur, fitur kontekstual, dan melakukan balancing data. Penelitian ini menggunakanskenario penelitian untuk menganalisis ekstraksi fitur, penggunaan fitur kontekstual, danbalancing data. Algoritme terbaik dilihat dari nilai recall pada kombinasi algoritme danfitur penelitian ini adalah Random Forest TF-IDF Unigram dan menggunakan tambahanfitur kontekstual deteksi uang dan kata-kata menjual dengan data yang seimbang. Nilairecall 88.37% didapatkan dari hasil kombinasi algoritme dan fitur tersebut. Female Daily Network is a company engaged in social media. Female Daily has socialmedia to share experiences using beauty products called Female Daily. Female Daily hasregulations not to use the Female Daily Platform to promote, sell products and serviceson social media platforms in Female Daily. However, users on Female Daily sometimesviolate these rules in their posts and cause other users to be annoyed about it. Admins atFemale Daily have difficulty identifying users who violate these rules and ban their postscontaining product sales due to the limited number of admins with the number of poststhat enter each day. Text mining can also overcome this problem by determining theclassification automatically by creating a system that carries out the learning processfrom the available post words. Algorithms that can be used to carry out the text miningprocess in this research are Support Vector Machine (SVM), Naïve Bayes (NB), DecisionTree (DT), and Random Forest (RF). This study uses a combination of feature extraction,contextual features, and data balancing. This study uses research scenarios to analyzefeature extraction, contextual feature usage, and data balancing. The best algorithm seenfrom the recall value in the combination of algorithms and features of this research is theRandom Forest TF-IDF Unigram and uses additional contextual features to detect moneyand selling words with balanced data. The recall value of 88.37% is obtained from theresults of the combination of these algorithms and features. |