Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 72419 dokumen yang sesuai dengan query
cover
Shierviona Angelica
"Dalam menghadapi persaingan yang semakin ketat di industri penyiaran radio, pemahaman mendalam terhadap kebutuhan dan preferensi pendengar menjadi aspek yang krusial. Opini pendengar kini dapat diperoleh secara mudah melalui unggahan di media sosial, namun tingginya volume data membuat analisis manual menjadi tidak efisien. Oleh karena itu, penelitian ini memanfaatkan metode analisis sentimen untuk menggali opini publik dari data teks yang diperoleh melalui media sosial X, sekaligus mengidentifikasi evaluasi pendengar terhadap berbagai aspek siaran radio. Penelitian difokuskan pada tiga stasiun radio dengan karakteristik segmentasi audiens yang berbeda, yaitu FeMale Radio, Delta FM, dan Prambors. Sentimen yang dianalisis dikategorikan ke dalam dua kelas, yakni positif dan negatif, serta dikelompokkan ke dalam tiga dimensi penilaian: program, layanan, dan teknis. Hasil penelitian mengungkapkan adanya variasi persepsi di antara pendengar terhadap masing-masing kategori untuk seluruh stasiun radio, yang merefleksikan kecenderungan preferensi sesuai dengan segmen targetnya. Peningkatan akurasi klasifikasi sentimen model secara signifikan terbukti setelah proses pelabelan data dilakukan oleh dua anotator dengan evaluasi konsistensi. Temuan ini diharapkan dapat memberikan kontribusi strategis dalam proses pengambilan keputusan manajemen dan peningkatan kualitas siaran, terutama bagi FeMale Radio.

In the face of increasingly intense competition in the radio broadcasting industry, a deep understanding of listener needs and preferences has become crucial. Listener opinions can now be easily obtained through social media posts; however, the growing volume of data renders manual analysis inefficient. Therefore, this study employs sentiment analysis methods to extract public opinion from textual data collected via the social media platform X and to identify listeners’ evaluations of various aspects of radio broadcasting. The research focuses on three radio stations with distinct audience segmentations: FeMale Radio, Delta FM, and Prambors. The analyzed sentiments are classified into two categories—positive and negative—and grouped into three evaluation dimensions: program, service, and technical. The findings reveal variations in listener perceptions toward each category for all radio station, reflecting preference tendencies aligned with their respective target segments. A significant increase in the accuracy of the model's sentiment classification was evident after the data labeling process was carried out by two annotators with consistency evaluation. These insights are expected to provide strategic contributions to managerial decision-making processes and improvements in broadcast quality, particularly for FeMale Radio. "
Depok: Fakultas Teknik Universitas Indonesia, 2025
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nadya Safitri
"Pemilihan metode machine learning atau deep learning menjadi suatu permasalahan dalam klasifikasi. Hal ini didapatkan dari penelitian yang menunjukkan bahwa deep learning kinerjanya lebih baik daripada machine learning, namun terdapat penelitian bahwa kedua metode tersebut kinerjanya tidak menentu tergantung dataset yang digunakan. Oleh karena itu, penelitian ini membandingkan kinerja dari machine learning dan deep learning untuk permasalahan klasifikasi teks dan analisis sentimen terhadap dampak Covid-19 di Indonesia. Hasil penelitian ini menunjukkan bahwa kinerja pada klasifikasi teks dan analisis sentimen menggunakan metode machine learning lebih baik dibandingkan dengan deep learning. Hasil penelitian mengenai klasifikasi teks menunjukkan bahwa kinerja metode machine learning yaitu Label Powerset dan Random Forest menghasilkan akurasi 77 % sedangkan kinerja metode deep learning yaitu Long Short-Term Memory (LSTM) dan Gate Reccurent Unit (GRU) menghasilkan akurasi 48%. Hasil penelitian mengenai analisis sentimen menunjukkan bahwa kinerja metode machine learning yaitu Label Powerset dan Random Forest menghasilkan akurasi 63 % sedangkan kinerja metode deep learning yaitu Long Short-Term Memory (LSTM) dan Gate Reccurent Unit (GRU) menghasilkan akurasi 55% dan 54%. Keseimbangan jumlah label pada semua label mempengaruhi hasil dari klasifikasi. Oleh karena itu, disarankan untuk menggunakan metode untuk menyeimbangkan jumlah label yang digunakan untuk klasifikasi.

The choice of machine learning or deep learning methods becomes a problem in classification. This is obtained from research which shows that deep learning performs better than machine learning, but there is research that the two methods perform erratically depending on the dataset used. Therefore, this study compares the performance of machine learning and deep learning for text classification problems and sentiment analysis on the impact of Covid-19 in Indonesia. The results of this study indicate that the performance of text classification and sentiment analysis using machine learning methods is better than deep learning. The results of research on text classification show that the performance of machine learning methods, namely Label Power and Random Forest, produces an accuracy of 77%, while the performance of deep learning methods, namely Long Short-Term Memory (LSTM) and Gate Recurrent Unit (GRU), produces an accuracy of 48%. The results of the research on sentiment analysis show that the performance of machine learning methods, namely Label Power and Random Forest, produces an accuracy of 63%, while the performance of deep learning methods, namely Long Short-Term Memory (LSTM) and Gate Recurrent Unit (GRU), produces 55% and 54% accuracy. The balance of the number of labels on all labels affects the results of the classification. Therefore, it is advisable to use a method to balance the number of labels used for classification."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Andi Suciati
"Ulasan dapat mempengaruhi orang-orang dalam mengambil keputusan karena orang-orang dapat mengetahui ulasan yang diberikan merupakan ulasan positif atau negatif. Namun, sentimen positif, negatif, atau netral, tanpa mempertimbangkan emosi yang ada dianggap kurang, karena emosi dapat memperkuat hasil sentimen. Tesis ini membahas perbandingan antara machine learning dan deep learning dalam mengklasifikasikan sentimen dan emosi pada ulasan dengan metode klasifikasi multi-label. Pada perbandingan machine learning, digunakan metode transformasi masalah Label Powerset (LP), Binary Relevance (BR), dan Classifier Chain (CC), serta algoritma Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), dan Extra Tree Classifier (ET). Fitur yang dibandingkan yaitu n-gram language model (unigram, bigram, unigram-bigram). Untuk deep learning, algoritma yang dibandingkan yaitu Gated Recurrent Unit (GRU) dan Bidirectional Long Short-Term Memory (BiLSTM), menggunakan word embedding yang dibangun sendiri. Hasil perbandingan menunjukkan bahwa RF unggul dengan nilai F1-score 88.4% dan 89.54% dengan metode CC untuk aspek makanan, dan LP untuk harga. Untuk aspek pelayanan dan suasana, ET memimpin dengan 92.65% dan 87.1% dengan metode LP dan CC berturut-turut. Sedangkan pada perbandingan deep learning, GRU dan BiLSTM mendapatkan nilai F1-score yang sama untuk aspek makanan, 88.16%. Pada aspek harga, GRU memimpin dengan 83.01%. Namun untuk pelayanan, dan suasana, BiLSTM mendapatkan nilai lebih tinggi dengan F1-score.

Review can affect the decision making from people because people can know whether the review is positive, or negative. However, the sentimen positive, neagtive, and neutral, without considering the emotion is considered not enough because emotion can strenghten the sentimen result. This thesis explaining about the comparison of machine learning and deep learning in sentiment as well as emotion classification with multi-label classification. In machine learning comparion, the problem transformation that were used are Label Powerset (LP), Binary Relevance (BR), and Classifier Chain (CC), with Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), and Extra Tree Classifier (ET) as algorithms. The features that compared are yaitu n-gram language model (unigram, bigram, unigram-bigram). For deep learning, algorithms that were compared are Gated Recurrent Unit (GRU) and Bidirectional Long Short-Term Memory (BiLSTM), using self-developed word embedding. The comparion results RF dominates with F1-score 88.4% and 89.54% with CC method for food aspect, and LP for price. For service and ambience aspect, ET leads with 92.65% and 87.1% with LP and CC methods, respectively. On the other hand, in deep learning comparison, GRU and BiLSTM obtained similar F1- score for food aspect, 88.16%. On price aspect, GRU leads 83.01%. However, for service and ambience BiLSTM obtained higher F1-score 89.03% and 84.78%"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Timotius Victory
"Pengguna media sosial di Indonesia merupakan salah satu yang terbanyak di dunia. Hal ini mendorong pemilik produk atau layanan menggunakan media sosial sebagai saluran utama untuk penjualan dan layanan pelanggan. Masyarakat Indonesia cenderung mencari ulasan online sebelum memutuskan pembelian, sehingga ulasan pengguna sangat mempengaruhi keputusan pembelian dan keberhasilan bisnis. Oleh karena itu, pemilik produk dan layanan harus cepat tanggap terhadap sentimen ulasan pengguna untuk mempertahankan reputasi dan menghindari penurunan penjualan. Analisis sentimen adalah salah satu cara untuk mengetahui sentimen terhadap produk atau layanan. Terdapat pendekatan machine learning dan deep learning dalam analisis sentimen. Penggunaan machine learning pada analisis sentimen ulasan pengguna berbahasa Indonesia telah banyak dilakukan, namun eksplorasi dalam bidang deep learning masih jarang ditemukan. Penelitian ini menggunakan model CNN-BiLSTM dan BiLSTM-CNN yang dibandingkan dengan logistic regression, support vector machine, dan naïve bayes. Pada skenario pertama, analisis ulasan pengguna di Traveloka menunjukkan model BiLSTM-CNN dengan Precision tertinggi 85% dan AUC 82.14%, serta model Support Vector Machine (SVM) dengan Accuracy 83.25% dan F1-Score 86.53%. Pada skenario kedua, analisis ulasan pengguna provider telekomunikasi menunjukkan SVM sebagai yang terbaik dengan Accuracy 78.15%, Precision 68.78%, F1-Score 76.33%, dan AUC 77.36%. Dari hasil ini, model machine learning lebih unggul dibandingkan deep learning.

Social media users in Indonesia are among the largest in the world. This drives product or service owners to use social media as the main channel for sales and customer service. Indonesian consumers tend to look for online reviews before making a purchase decision, so user reviews greatly influence purchasing decisions and business success. Therefore, product and service owners must quickly respond to user review sentiments to maintain reputation and avoid sales decline. Sentiment analysis is one way to understand the sentiment towards a product or service. There are machine learning and deep learning approaches in sentiment analysis. The use of machine learning in sentiment analysis of user reviews in Indonesian has been widely conducted, but exploration in the field of deep learning is still rarely found. This study uses CNN-BiLSTM and BiLSTM-CNN models compared to logistic regression, support vector machine, and naïve bayes. In the first scenario, analysis of user reviews on Traveloka shows the BiLSTM-CNN model with the highest Precision of 85% and AUC of 82.14%, and the Support Vector Machine (SVM) model with an Accuracy of 83.25% and F1-Score of 86.53%. In the second scenario, analysis of user reviews of telecommunications providers shows SVM as the best with an Accuracy of 78.15%, Precision of 68.78%, F1-Score of 76.33%, and AUC of 77.36%. From these results, machine learning models outperform deep learning models."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Azizah Zuhriya Nurmadina
"Model deep learning adalah model dengan banyak lapisan jaringan saraf tiruan. Model Bidirectional Gated Recurrent Unit (BiGRU) adalah salah satu jenis model deep learning yang memproses urutan data dalam dua arah, yaitu arah maju dan arah mundur. Hal tersebut memungkinkan model BiGRU untuk mengakses informasi masa depan dan masa lalu dari setiap titik dalam urutan data untuk pemahaman konteks yang lebih baik. Model BiGRU dapat digunakan untuk analisis sentimen, yaitu proses mengategorikan sentimen opini dalam teks menjadi negatif, netral, atau positif. Representasi teks yang digunakan pada penelitian ini adalah Bidirectional Encoder Representations from Transformers (BERT) karena kemampuannya memahami kata secara kontekstual sehingga meningkatkan akurasi. Salah satu masalah umum pada analisis sentimen adalah ketidakseimbangan data Penggunaan data tidak seimbang mempengaruhi kinerja model dalam melakukan klasifikasi sentimen karena bias terhadap kelas mayoritas. Oleh karena itu, penggunaan Synthetic Minority Oversampling Technique (SMOTE) dalam mengatasi ketidakseimbangan kelas pada data dilakukan pada penelitian ini. SMOTE digunakan untuk melakukan oversampling pada data kelas minoritas dan dipasangkan dengan model BiGRU yang menggunakan fungsi kerugian categorical cross entropy menghasilkan kinerja dengan nilai akurasi sebesar 85,52% yang merupakan akurasi tertinggi dibandingkan dengan daripadamodel BiGRU dengan fungsi kerugian categorical cross entropy tanpa penanganan SMOTE (model standar dalam penelitian ini) dan model BiGRU dengan fungsi kerugian weighted cross entropy yang dibangun untuk memperkuat bukti bahwa model yang diajukan adalah model terbaik.

Deep learning models are models with multiple layers of artificial neural networks. The Bidirectional Gated Recurrent Unit (BiGRU) model is one type of deep learning model that processes data sequences in two directions, the forward direction and the backward direction. This allows the BiGRU model to access future and past information from each point in the data sequence for better context understanding. The BiGRU model can be used for sentiment analysis, which is the process of categorizing the sentiment of opinions in text into negative, neutral, or positive. The text representation used in this research is Bidirectional Encoder Representations from Transformers (BERT) because of its ability to understand words contextually to increase accuracy. One of the common problems in sentiment analysis is data imbalance. The use of unbalanced data affects the performance of the model in performing sentiment classification due to bias towards the majority class. Therefore, the use of Synthetic Minority Oversampling Technique (SMOTE) in overcoming class imbalance in the data is done in this study. SMOTE is used to perform oversampling on minority class data and paired with the BiGRU model using the categorical cross entropy loss function results in performance with an accuracy value of 85.52% which is the highest accuracy compared to the BiGRU model with the categorical cross entropy loss function without SMOTE handling (the standard model in this study) and the BiGRU model with the weighted cross entropy loss function built to strengthen the evidence that the proposed model is the best model."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Maranatha Florensia Wijaya
"Analisis sentimen merupakan bidang studi yang menganalisis pendapat seseorang terhadap suatu entitas untuk mencari polaritas sentimennya. Potensi manfaat yang besar didukung dengan ketersediaan data teks beropini yang melimpah di internet memicu dikembangkannya model yang mampu melakukan analisis sentimen secara otomatis dan seakurat mungkin. Dua diantaranya adalah Long Short-Term Memory (LSTM) dan Convolutional Neural Network (CNN) yang merupakan arsitektur deep learning. LSTM digunakan karena dapat menangkap aliran informasi pada kalimat, sedangkan CNN digunakan karena kemampuannya dalam mengekstrak fitur penting dari tiap penggalan kalimat atau region. Kedua model ini dapat digabungkan menjadi model gabungan LSTM-CNN yang telah terbukti mampu meningkatkan akurasi model. Penelitian ini kemudian akan mengajukan modifikasi pada model gabungan LSTM-CNN dengan mengganti LSTM menjadi Bidirectional LSTM (BiLSTM) dan CNN menjadi CNN Multi Region Size CNNMRS sehingga terbentuk tiga model modifikasi yaitu BiLSTM-CNN, LSTM-CNNMRS, dan BiLSTM-CNNMRS. Implementasi model, baik untuk model gabungan LSTM-CNN standar maupun model modifikasi, dilakukan pada data tweets berbahasa Indonesia. Hasilnya, didapatkan kesimpulan bahwa penggunaan BiLSTM untuk menggantikan LSTM pada model gabungan LSTM CNN tidak meningkatkan akurasi dari model. Hal berbeda didapatkan dari penggunaan CNNMRS untuk menggantikan CNN yang memberikan peningkatan akurasi pada model."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Suci Fitriyani
"Analisis sentimen merupakan studi komputasi untuk menganalisis opini seseorang terhadap suatu entitas yang diekspresikan dalam sebuah teks. Tersedia cukup banyak model machine learning terutama deep learning yang dapat digunakan untuk melakukan analisis sentimen seperti Convolutional Neural Network (CNN) dan Bidirectional Long Short-Term Memory (BiLSTM). Pada dasarnya, model deep learning tidak dapat memproses langsung sebuah data dalam bentuk teks sehingga diperlukan metode untuk mentransformasi teks menjadi tensor numerik seperti word embedding. Pada penelitian ini, diajukan model gabungan CNN-BiLSTM dengan word embedding fastText untuk melakukan analisis sentimen. Model tersebut dilatih menggunakan data tweet berbahasa Indonesia tentang opini masyarakat mengenai rencana subsidi pembelian kendaraan listrik di Indonesia. Data tersebut diklasifikasikan menjadi sentimen positif, negatif, dan netral dan ditemukan bahwa komposisi dari ketiga sentimen tersebut tidaklah seimbang (imbalanced dataset) dimana kelas positif memiliki lebih sedikit data dibanding kelaskelas lainnya. Untuk mengatasi masalah tersebut, digunakan metode resampling SMOTE agar jumlah data pada kelas positif dapat mengimbangi kelas lainnya. Model fastTextCNN-BiLSTM diukur performanya dengan melihat nilai akurasi, precision, recall, dan f1-score. Dari hasil penelitian didapat bahwa model gabungan CNN-BiLSTM memberikan nilai akurasi, precision, recall, dan f1-score yang paling baik dibanding model CNN dan BiLSTM saja. Model-model yang menggunakan word embedding fastText juga memberikan performa yang lebih baik dibanding model tanpa fastText (menggunakan word embedding standar). Secara keseluruhan, model gabungan fastTextCNN-BiLSTM ditemukan memiliki performa yang lebih baik dibandingkan dengan model-model lainnya.

Sentiment analysis is a computational study to analyze person’s opinion about an entity expressed in text. There are several machine learning models, especially deep learning models that can be used for sentiment analysis, such as Convolutional Neural Network (CNN) and Bidirectional Long Short-Term Memory (BiLSTM). Essentially, deep learning models cannot directly process textual data and they need a method to transform text into numerical tensors such as word embedding. In this research, a hybrid model CNN-BiLSTM with fastText word embedding is proposed for sentiment analysis. The model is trained using Indonesian tweets data regarding public opinions on the plan for subsidizing the purchase of electric vehicles in Indonesia. The data is classified into positive, negative, and neutral sentiments, and it is found that the composition of these sentiments is imbalanced, with the positive class having fewer data compared to the other classes. To address this issue, the SMOTE resampling method is used to balance the data in the positive class with the other classes. The performance of the fastText-CNNBiLSTM model is measured by accuracy, precision, recall, and f1-score. The research results show that the hybrid model CNN-BiLSTM achieves the highest accuracy, precision, recall, and f1-score compared to the single models CNN and BiLSTM. Models with fastText word embedding also outperform models without fastText (with standard word embedding). Overall, the hybrid model fastText-CNN-BiLSTM is found to outperform other models in terms of performance."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Lucky Dwi Cahya
"Banyaknya opini yang diunggah oleh pengguna media sosial di Indonesia, mengakibatkan dapat dilakukannya penelitian, salah satunya adalah analisis sentimen. Beberapa model machine learning yang dapat digunakan untuk analisis sentimen yaitu Long Short-Term Memory (LSTM) dan Convolutional Neural Network (CNN). Pada penelitian ini menggunakan modifikasi dari model CNN, yaitu model CNN-Multi Region Size (CNNMRS). Model LSTM dan CNNMRS dapat digabungkan menjadi model gabungan CNNMRS-LSTM dan LSTM-CNNMRS. Penerapan lifelong learning untuk permasalahan analisis sentimen pada penelitian ini dilakukan dengan menggunakan model CNNMRS, LSTM, CNNMRS-LSTM, dan LSTM-CNNMRS. Kemampuan lifelong learning untuk transfer knowledge model CNNMRS menunjukkan hasil yang lebih baik dibandingkan dengan ketiga model lainnya. Pada permasalahan lifelong learning untuk loss of knowledge model LSTM lebih baik dari ketiga model lainnya. Pada penelitian ini juga dilihat pengaruh lifelong learning yang menerapkan pembaruan vocabulary yaitu menggunakan vocabulary yang ada pada setiap source domain yang digunakan. Kemampuan lifelong learning dengan pembaruan vocabulary untuk transfer knowledge model LSTM menunjukkan hasil yang lebih baik dibandingkan dengan ketiga model lainnya. Pada permasalahan lifelong learning dengan pembaruan vocabulary untuk loss of knowledge model LSTM-CNNMRS lebih baik dari ketiga model lainnya. Berdasarkan hasil yang diperoleh pada penelitian ini, pembaruan vocabulary dapat meningkatkan kemampuan dari lifelong learning.

The number of opinions uploaded by social media users in Indonesia has resulted in various studies being carried out, one of which is sentiment analysis. Several machine learning models that can be used for sentiment analysis are Long Short-Term Memory (LSTM) and Convolutional Neural Network (CNN). This study uses a modification of the CNN model, namely the CNN-Multi Region Size (CNNMRS) model. The LSTM and CNNMRS models can be combined into a combined CNNMRS-LSTM and LSTM-CNNMRS model. The application of lifelong learning for sentiment analysis problems in this study was carried out using the CNNMRS, LSTM, CNNMRS-LSTM, and LSTM-CNNMRS models. The ability of lifelong learning to transfer knowledge of the CNNMRS model shows better results than the other three models. On the problem of lifelong learning for loss of knowledge, the LSTM model is better than the other three models. This study also looks at the effect of lifelong learning by applying vocabulary updates, namely using the existing vocabulary in each source domain used. The lifelong learning ability with vocabulary updates for the transfer of knowledge of the LSTM model shows better results than the other three models. In lifelong learning problems with vocabulary updates for loss of knowledge the LSTM-CNNMRS model is better than the other three models. Based on the results obtained in this study, updating vocabulary can improve the ability of lifelong learning."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Agastya Vitadhani
"Kombinasi thumbnail dan judul pada portal berbagi video sangat berguna untuk memberikan gambaran mengenai isi video. Tetapi, terdapat juga thumbnail yang bersifat clickbait yang lebih bertujuan memancing masyarakat untuk menonton video. Bahkan terdapat clickbait thumbnail yang dibuat untuk menyesatkan masyarakat dengan agenda untuk membangun opini tertentu. Untuk membatasi variasi pada dataset permasalahan dipersempit pada clickbait thumbnail yang mengandung ujaran kebencian terhadap dai. Thumbnail yang dipilih sebagai dataset terdiri dari foto satu orang atau lebih dengan disertai teks narasi. Dari thumbnail diperoleh informasi berupa identitas individu dengan menggunakan face recognition dan teks narasi dengan menggunakan optical character recognition. Untuk mengolah teks narasi dari thumbnail dan judul video digunakan teknik analisis sentimen. Dibangun model machine learning dengan data yang diperoleh dari identitas, teks narasi dan judul video dengan menggunakan model SVM. Evaluasi terhadap model machine learning dilakukan dengan validasi silang 5-fold. Evaluasi menghasilkan akurasi 0.968, sensitivitas 0.968, nilai presisi 0.9698 dan F1-Score 0.967.

The combination of thumbnails and titles on video sharing portals is effective for providing an overview of the content of the video. However, there are also clickbait thumbnails that are more intended to lure people into watching the videos. There are even clickbait thumbnails created to mislead the public with an agenda to build a particular opinion. To limit the variation in the dataset the problem was narrowed down to clickbait thumbnails containing hate speech against dai. Thumbnails selected as datasets consist of photos of one or more people accompanied by narrative text. From the thumbnails, information is obtained in the form of individual identities using face recognition and narrative texts using optical character recognition. To process narrative text from thumbnails and video titles, sentiment analysis techniques are used. A machine learning model was built with data obtained from identity, narration text, and video titles using the SVM model. Evaluation of the machine learning model is carried out with 5-fold cross-validation. The evaluation resulted in an accuracy of 0.968, a sensitivity of 0.968, a precision value of 0.9698, and an F1-Score of 0.967. "
Depok: Fakultas Teknik Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Agastya Vitadhani
"Kombinasi thumbnail dan judul pada portal berbagi video sangat berguna untuk memberikan gambaran mengenai isi video. Tetapi, terdapat juga thumbnail yang bersifat clickbait yang lebih bertujuan memancing masyarakat untuk menonton video. Bahkan terdapat clickbait thumbnail yang dibuat untuk menyesatkan masyarakat dengan agenda untuk membangun opini tertentu. Untuk membatasi variasi pada dataset permasalahan dipersempit pada clickbait thumbnail yang mengandung ujaran kebencian terhadap dai. Thumbnail yang dipilih sebagai dataset terdiri dari foto satu orang atau lebih dengan disertai teks narasi. Dari thumbnail diperoleh informasi berupa identitas individu dengan menggunakan face recognition dan teks narasi dengan menggunakan optical character recognition. Untuk mengolah teks narasi dari thumbnail dan judul video digunakan teknik analisis sentimen. Dibangun model machine learning dengan data yang diperoleh dari identitas, teks narasi dan judul video dengan menggunakan model SVM. Evaluasi terhadap model machine learning dilakukan dengan validasi silang 5-fold. Evaluasi menghasilkan akurasi 0.968, sensitivitas 0.968, nilai presisi 0.9698 dan F1-Score 0.967.

The combination of thumbnails and titles on video sharing portals is effective for providing an overview of the content of the video. However, there are also clickbait thumbnails that are more intended to lure people into watching the videos. There are even clickbait thumbnails created to mislead the public with an agenda to build a particular opinion. To limit the variation in the dataset the problem was narrowed down to clickbait thumbnails containing hate speech against dai. Thumbnails selected as datasets consist of photos of one or more people accompanied by narrative text. From the thumbnails, information is obtained in the form of individual identities using face recognition and narrative texts using optical character recognition. To process narrative text from thumbnails and video titles, sentiment analysis techniques are used. A machine learning model was built with data obtained from identity, narration text, and video titles using the SVM model. Evaluation of the machine learning model is carried out with 5-fold cross-validation. The evaluation resulted in an accuracy of 0.968, a sensitivity of 0.968, a precision value of 0.9698, and an F1-Score of 0.967. "
Depok: Fakultas Teknik Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>