Pemilihan umum presiden merupakan momen krusial dalam demokrasi, di mana opini publik memainkan peran penting dalam menentukan hasil. Dalam era digital, media sosial menjadi platform utama bagi masyarakat untuk menyampaikan pandangan dan opini mereka. Penelitian ini bertujuan untuk menganalisis sentimen masyarakat terhadap pemilihan bakal calon presiden Indonesia 2024, yaitu Ganjar, Prabowo, dan Anies melalui media sosial X menggunakan model IndoBERT. Data dikumpulkan dari media sosial X melalui teknik crawling untuk memastikan relevansi data. Model IndoBERT diterapkan untuk melakukan analisis sentimen terhadap data teks yang diklasifikasikan ke dalam kategori positif, negatif, dan netral. Hasil menunjukkan bahwa model dengan hyperparameter terbaik (learning rate 5e-6 dan data splitting 0.2) mencapai akurasi 94.66% dalam mengklasifikasikan sentimen, dengan nilai precision, recall, dan f1-score yang konsisten. Meskipun demikian, terdapat kecenderungan bahwa model memprediksi kurang atau memprediksi berlebih jumlah data pada semua kandidat. Analisis dari precision-recall curve menunjukkan bahwa ketidakseimbangan data memiliki pengaruh terhadap performa model, namun model dengan hyperparameter terbaik tetap mencapai nilai AUC 0.92 terhadap ketidakseimbangan data tersebut. Analisis sentimen ini memberikan wawasan penting bagi partai politik dalam menentukan strategi kampanye dan mengidentifikasi kandidat yang paling disukai oleh masyarakat dalam pemilihan umum presiden 2024. The presidential election is a crucial moment in democracy, where public opinion plays a vital role in determining the outcome. In the digital era, social media has become a primary platform for people to express their views and opinions. This research aims to analyze public sentiment towards the 2024 Indonesian presidential candidates—Ganjar, Prabowo, and Anies—through social media platform X using the IndoBERT model. Data was collected from social media X through crawling techniques to ensure data relevance. The IndoBERT model was applied to perform sentiment analysis on the text data, classifying it into positive, negative, and neutral categories. The results show that the model with the best hyperparameters (learning rate of 5e-6 and data splitting of 0.2) achieved 94.66% accuracy in sentiment classification, with consistent precision, recall, and f1-score values. However, there is a tendency for the model to underpredict or overpredict the amount of data for all candidates. Analysis of the precision-recall curve indicates that data imbalance affects the model's performance, but the model with the best hyperparameters remains achieved AUC 0.92, indicating robustness against this imbalance. This sentiment analysis provides important insights for political parties in determining campaign strategies and identifying the most favored candidates by the public in the 2024 presidential election. |