Penelitian analisis sentimen sudah banyak dikaji untuk berbagai bahasa, termasuk bahasa Indonesia. Namun sayangnya, belum terdapat penelitian benchmarking analisis sentimen untuk teks berbahasa Indonesia. Hal ini menyebabkan kesulitan bagi para peneliti untuk mendapatkan informasi mengenai metode klasifikasi dengan performa terbaik pada saat ini. Dengan adanya permasalahan tersebut, penelitian ini dilakukan dengan tujuan membantu memberikan arahan untuk penelitian sentimen analisis dalam bahasa Indonesia. Untuk dapat memberikan arahan, penelitian ini berusaha untuk membandingkan pendekatan klasifikasi sentimen rule-based, machine learning dan deep learning serta teknik ekstraksi fitur untuk mendapatkan skenario analisis sentimen terbaik. Berdasarkan hasil eksperimen penelitian, ditunjukkan bahwa klasifikasi terbaik dicapai oleh deep learning, disusul dengan metode klasifikasi machine learning dan rule-based. Pencapaian nilai terbaik pada klasifikasi menggunakan deep learning diperoleh menggunakan model BERT. Untuk klasifikasi menggunakan machine learning, didapatkan bahwa nilai F1-Score terbaik diperoleh saat digunakan metode klasifikasi Logistic Regression dengan teknik ekstraksi fitur kombinasi unigram dengan leksikon kombinasi. Sedangkan untuk klasifikasi rule-based nilai F1-Score tertinggi didapatkan menggunakan metode klasifikasi adjektiva.
Currently, there have been many kinds of research done on sentiment analysis. However, there are no papers on sentiment analysis benchmarks for the Indonesian language. Due to the absence of such research, it became difficult for researchers to get information about classifiers with the best performance. Because of this problem, this research is conducted so it would be easier for researchers to get information and direction on doing Indonesian sentiment analysis. In this paper, we held an experiment comparing sentiment classification using rule-based, machine learning, and deep learning and comparing feature extraction techniques to achieve the best sentiment analysis scenario. Based on our experiments in this research, prediction using deep learning classification gave the best result compared to machine learning and rule-based classification. Using deep learning classification, the BERT model is used to get the best result. The best F1-Score for machine learning classification is obtained using a Logistic Regression classifier alongside a combination of unigram and combined lexicon feature extraction. Meanwhile, the best F1-Score for the rule-based classification is obtained using the Adjective classification method