ABSTRAKJakarta merupakan daerah yang memiliki ciri tersendiri di Indonesia, yakni sebagai ibukota negara.Banyak permasalahan yang dihadapi oleh Pemerintahan Provinsi Daerah Khusus Ibukata Jakarta (Pemprov DKI Jakarta), diantaranya yang paling sering kita dengar adalah kemacetan lalu lintas. Jumlah rata-rata laporan masyarakat tentang kemacetan lalu lintas adalah 343 laporan perbulan, sedangkan penanganan yang dapat diselesaikan hanya 80 laporan perbulan. Banyaknya jumlah laporan masyarakat terhadap masalah kemacetan lalu lintas, maka membutuhkan prioritas terhadap laporan yang harus diutamakan penanganannya.
Dalam penelitian ini melakukan analisis sentimen pada media sosial Twitter untuk dapat melakukan prioritas penanganan masalah kemacetan di Jakarta berdasarkan tingkat kepuasan masyarakat terhadap kondisi lalu lintas di Jakarta. Langkah-langkah dalam melakukan analisis sentimen antara lain preprocessing, feature extraction dan classification. Preprocessing data teks yang dilakukan antara lain case folding, tokenisasi, filter token, translate dan stopword removal. Sedangkan feature extraction yang digunakan adalah model unigram dan bigram dengan kamus sentimen, sedangkan pembobotan menggunakan metode Term Frequency - Inverse Document Frequency(TF-IDF). Pembuatan Model klasifikasi sentimen menggunakan dua algoritma yaitu Naïve Bayes dan Support Vector Machine (SVM).Sedangkan mengukur sentimen masyarakat menggunakan Net Sentiment Score dari Netbasedengan visualisasi menggunakan calendar view.
Hasil dari pembuatan model klasifikasi sentimen dalam penelitian menunjukkan bahwa algoritma SVM menghasilkan akurasi yang lebih tinggi dari pada algoritma Naïve Bayes. Hasil dari visualisasi dengan calendar view menunjukkan bahwa sentimen masyarakat memiliki nilai Net Sentiment Score yang rendah di hari Kamis dan Jumat pada waktu sore. Sedangkan pada hari Minggu dan awal bulan memiliki nilai net sentiment score yang lebih tinggi. Sehingga pada waktu Kamis dan Jumat pada waktu sore perlu penanganan masalah kemacetan yang lebih utama.
ABSTRACTJakarta is an area that has its own characteristics in Indonesia as the nation's capital. Many problems faced by the Jakarta Provincial Government, among the most frequently heard is a traffic congestion. Average number of public complain about the traffic congestion was 343 reports per month, while the handling can be solved only 80 reports per month. A large number of public complain about the problem of traffic congestion, it takes priority over the handling of the complain should come first.
In this research perform sentiment analysis on Twitter social media to be able to prioritize the handling of the problem of traffic congestion in Jakarta based on the level of public satisfaction about traffic conditions in Jakarta. Steps in doing sentiment analysis that is preprocessing, feature extraction and classification. Preprocessing text data use in this research is case folding,tokenization, filter token, translate and stopword removal. Feature extraction use an unigram and a bigram models with sentiment dictionary, and then the weighting use Term Frequency - Inverse Document Frequency (TF-IDF) method. To make the Sentiment classification model is using two algorithms, that is Naïve Bayes and Support Vector Machine (SVM). To measure public sentiment using Net Sentiment Score from Netbase with visualization using calendar view.
The results of the modeling sentiment classification in the research show that the SVM algorithm produce higher accuracy than Naïve Bayes algorithm. The results of visualization with calendar view shows that public sentiment has low value of Net Sentiment Score Thursday and Friday in the afternoon. Meanwhile, on Sunday and the beginning of the month has high value of Net Sentiment Score. So that at the time of Thursday and Friday in the afternoon need of handling the problem of traffic congestion should first to be solve.