Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 191971 dokumen yang sesuai dengan query
cover
Tansa Trisna Astono Putri
"ABSTRAK
Kebebasan berpendapat melalui media sosial untuk mengungkapkan pikiran, pendapat dan tanggapan terhadap suatu topik tertentu menimbulkan dampak negatif berupa konten yang menebarkan kebencian. Penelitian ini bertujuan untuk melakukan deteksi sebuah informasi yang merupakan ujaran kebencian di media sosial Twitter. Data yang digunakan berjumlah 4.002 data sentimen terkait topik politik, agama, suku dan ras di Indonesia. Pada pembangunan model, penelitian ini menggunakan metode klasifikasi sentimen dengan algoritma machine learning seperti Na ve Bayes, Multi Level Perceptron, AdaBoost Classifier, Random Forest Decision Tree dan Support Vector Machine SVM . Di samping itu, penelitian ini juga melakukan perbandingan performa model dengan menggunakan unigram, bigram dan unigram-bigram dalam proses fitur ekstraksi dan penggunaan SMOTE untuk mengatasi imbalanced data. Evaluasi dari percobaan yang dilakukan menunjukkan bahwa algoritma AdaBoost menghasilkan model terbaik dengan nilai recall tertinggi yaitu 99.5 yang memiliki nilai akurasi sebesar 70.0 dan nilai F1-score sebesar 82.2 untuk klasifikasi ujaran kebencian apabila menggunakan bigram.

ABSTRACT
Freedom of expression through social media to express idea, opinion and view about current topic causes negative impact as the rise of hateful content. This study aims to detect a hate speech information through Twitter. Dataset of this study consists of 4.002 sentiment data related to politic, race, religion and clan topic. The model development of this study conducted by sentiment classification method with machine learning algorithm such as Na ve Bayes, Multi Level Perceptron, AdaBoost Classifier, Random Forest Decision Tree and Support Vector Machine SVM . We also conduct a comparison of model performance that used unigram, bigram, unigram bigram feature and SMOTE to handle imbalanced data. Evaluation of this study showed that AdaBoost algorithm resulted the best classification model with the highest recall model which was 99.5 , accuracy score as much as 70.0 and F1 score 82.2 to classify hate speech when using bigram features."
2018
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Muhammad Okky Ibrohim
"ABSTRAK
Penyebaran ujaran kebencian dan ujaran kasar di media sosial merupakan hal yang harus diidentifikasi secara otomatis untuk mencegah terjadinya konflik masyarakat. Selain itu, ujaran kebencian mempunyai target, golongan, dan tingkat tersendiri yang juga perlu diidentifikasi untuk membantu pihak berwenang dalam memprioritaskan kasus ujaran kebencian yang harus segera ditangani. Tesis ini membahas klasifikasi teks multi label untuk mengidentifikasi ujaran kasar dan ujaran kebencian disertai identifikasi target, golongan, dan tingkatan ujaran kebencian pada Twitter berbahasa Indonesia. Permasalahan ini diselesaikan menggunakan pendekatan machine learning menggunakan algoritma klasifikasi Support Vector Machine (SVM), Naïve Bayes (NB), dan Random Forest Decision Tree (RFDT) dengan metode transformasi data Binary Relevance (BR), Label Power-set (LP), dan Classifier Chains (CC). Jenis fitur yang digunakan antara lain fitur frekuensi term (word n-grams dan character n-grams), fitur ortografi (tanda seru, tanda tanya, huruf besar/kapital, dan huruf kecil), dan fitur leksikon (leksikon sentimen negatif, leksikon sentimen positif, dan leksikon kasar). Hasil eksperimen menunjukkan bahwa secara umum algoritma klasifikasi RFDT dengan metode transformasi LP memberikan akurasi yang terbaik dengan waktu komputasi yang cepat. Algoritma klasifikasi RFDT dengan metode transformasi LP menggunakan fitur word unigram memberikan akurasi sebesar 66,16%. Jika hanya mengidentifikasi ujaran kasar dan ujaran kebencian (tanpa disertai identifikasi target, golongan, dan tingkatan ujaran kebencian), algoritma klasifikasi RFDT dengan metode transformasi LP menggunakan gabungan fitur word unigram, character quadgrams, leksikon sentimen positif, dan leksikon kasar mampu memberikan akurasi sebesar 77,36%.


Hate speech and abusive language spreading on social media needs to be identified automatically to avoid conflict between citizen. Moreover, hate speech has target, criteria, and level that also needs to be identified to help the authority in prioritizing hate speech which must be addressed immediately. This thesis discusses multi-label text classification to identify abusive and hate speech including the target, category, and level of hate speech in Indonesian Twitter. This problem was done using machine learning approach with Support Vector Machine (SVM), Naïve Bayes (NB), and Random Forest Decision Tree (RFDT) classifier and Binary Relevance (BR), Label Power-set (LP), and Classifier Chains (CC) as data transformation method. The features that used are term frequency (word n-grams and character n-grams), ortography (exclamation mark, question mark, uppercase, lowercase), and lexicon features (negative sentiment lexicon, positif sentiment lexicon, and abusive lexicon). The experiment results show that in general RFDT classifier using LP as the transformation method gives the best accuracy with fast computational time. RFDT classifier with LP transformation using word unigram feature give 66.16% of accuracy. If only for identifying abusive language and hate speech (without identifying the target, criteria, and level of hate speech), RFDT classifier with LP transformation using combined fitur word unigram, character quadgrams, positive sentiment lexicon, and abusive lexicon can gives 77,36% of accuracy.

"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019
T52442
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhamad Rizki Yoga
"Ujaran kebencian merupakan ujaran yang dapat menimbulkan kebencian. Fenomena ujaran kebencian dapat muncul dalam berbagai konteks, seperti hukum, psikologi, hingga olahraga, terutama sepak bola. Tulisan ini bertujuan untuk mengetahui/menjelaskan bentuk ujaran kebencian dan medan makna yang digunakan oleh suporter sepak bola ketika menuturkan ujaran kebencian di kolom komentar media sosial Instagram. Metode yang digunakan dalam penelitian ini adalah deskriptif kualitatif. Data dalam penelitian ini adalah komentar suporter sepak bola yang berisi ujaran kebencian di kolom komentar media sosial Instagram. Sumber data penelitian ini berasal dari kolom komentar dalam unggahan foto di akun Instagram @plesbol.inc selama periode 1—29 Februari 2024. Pengumpulan data dilakukan pada 1—10 Maret 2024 dengan memilih 100 komentar, baik dalam bentuk frasa maupun kalimat. Analisis data dilakukan dengan tiga tahapan, yaitu mengidentifikasi makna literal dan kontekstual, mengidentifikasi bentuk ujaran kebencian, serta mengidentifikasi medan makna dari masingmasing data yang sudah dikumpulkan. Hasil analisis menunjukkan tiga bentuk ujaran kebencian yang berbeda, yaitu menghina, mengumpat, dan mencemarkan nama baik. Hasil analisis juga menunjukkan terdapat sebelas medan makna yang digunakan, yaitu sifat/ keadaan, binatang, kekerabatan, benda, aktivitas, pelaku kegiatan, anggota tubuh, perilaku komunikasi, penyakit, makhluk halus, dan penampilan fisik.

Hate speech is speech that can cause hatred. The phenomenon of hate speech can appear in various contexts, such as law, psychology, and sports, especially soccer. This paper aims to find out/explain the form of hate speech and the meaning field used by soccer supporters when saying hate speech in the Instagram social media comment section. The method used in this research is descriptive qualitative. The data in this study are soccer supporters' comments containing hate speech in the Instagram social media comment section. The data source of this research comes from the comments column in photo uploads on the @plesbol.inc Instagram account during the period February 1—29, 2024. Data collection was carried out on March 1—10, 2024 by selecting 100 comments, both in the form of phrases and sentences. Data analysis was carried out in three stages, namely identifying literal and contextual meanings, identifying forms of hate speech, and identifying the meaning field of each data that has been collected. The results of the analysis show three different forms of hate speech, namely insulting, swearing, and defaming. The results of the analysis also show that there are eleven fields of meaning used, namely nature/condition, animal, kinship, object, activity, actor, limb, communication behavior, disease, ethereal creature, and physical appearance."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
MK-pdf
UI - Makalah dan Kertas Kerja  Universitas Indonesia Library
cover
Nabila Khansa
"Ujaran kebencian dan bahasa kasar mempermudah penyebaran kekerasan di kehidupan nyata, sehingga muncul urgensi adanya pendeteksian secara otomatis. Untuk melanjutkan pekerjaan yang sudah dilakukan oleh Ibrohim dan Budi (2019), penelitian ini membahas dua isu terkait deteksi ujaran kebencian dan bahasa kasar pada mikroblog berbahasa Indonesia. Isu pertama adalah kajian terkait effect size fitur dan pengembangan model menggunakan fitur-fitur tersebut. Metode Analysis of Variance f-test, Logistic Regression Analysis, dan nilai Shapley digunakan untuk melakukan kajian effect size pada fitur-fitur yang dirancang secara manual. Kemudian, digunakan beberapa algoritma pemelajaran mesin untuk mengembangkan model prediksi berbasis fitur-fitur tersebut. Isu kedua adalah kajian bias dalam pengembangan model terkait keberadaan kata-kata bersifat netral pada data yang merupakan ujaran kebencian atau bahasa kasar. Kajian terkait bias dilakukan dengan menggunakan dataset uji bias. Dataset ini dikembangkan dengan menggantikan kata-kata yang dideteksi memiliki potensi adanya bias pada model yang dilatih menggunakan dataset hasil pekerjaan Ibrohim dan Budi (2019). Penelitian ini menunjukkan bahwa keberadaan kata-kata tertentu berpengaruh terhadap hasil deteksi ujaran kebencian dan bahasa kasar. Di antara kata-kata tersebut, terdeteksi beberapa kata-kata yang berpotensi bias, karena memiliki pengaruh terhadap pendeteksian padahal secara sendiri kata-kata yang dideteksi sebagai potensi bias tidak memiliki unsur kebencian atau bersifat kasar. Hasil evaluasi pengambilan sampel bootstrap menunjukkan Logistic Regression dan XGBoost sebagai model dengan akurasi terbaik dalam pendeteksian ujaran kebencian dan bahasa kasar. Namun, ketika model yang sudah dikembangkan digunakan untuk memprediksi dataset sintetis, didapatkan penurunan akurasi dalam pendeteksian ujaran kebencian. Hasil ini menandakan adanya bias pada model yang dikembangkan. Hasil tersebut didukung juga oleh hasil prediksi dengan akurasi rendah ketika model digunakan untuk melakukan pendeteksian ujaran kebencian pada dataset yang dikembangkan secara manual, tetapi ketika kata-kata bias digantikan dari data, akurasi model meningkat. Kontribusi yang diberikan oleh penelitian ini adalah pengembangan dataset uji bias secara otomatis dari dataset yang dikembangkan oleh Ibrohim dan Budi (2019) dan juga dataset uji bias yang dikembangkan secara manual.

Hate speech and abusive language facilitate the spread of violence in real life, hence the urgency of automatic detection. To continue the work done by Ibrohim dan Budi (2019), this research addresses two issues related to the detection of hate speech and abusive language on Indonesian-language microblogs. The first issue is a study on the effect size of features and the development of models using these features. Analysis of Variance f-test, Logistic Regression Analysis, and Shapley values are used to investigate the effect size of manually designed features. Several machine learning algorithms are then employed to develop prediction models based on these features. The second issue involves studying bias in model development concerning the presence of neutral words in data that constitute hate speech or abusive language. The study related to bias is conducted by using a bias test dataset. This dataset is developed by replacing words that are detected to have the potential for bias in models trained using the dataset resulting from the work of Ibrohim dan Budi (2019). This research demonstrates that certain words significantly influence the detection of hate speech and abusive language. Among these words, some are identified as potentially biased, as they affect detection despite not inherently containing hate or abusive elements. The results of bootstrap sampling evaluation indicate that Logistic Regression and XGBoost are the models with the highest accuracy in detecting hate speech and abusive language. However, when the developed models are used to predict synthetic datasets, a significant decrease in accuracy is observed in hate speech detection. This finding indicates the presence of bias in the developed models. This result is further supported by low-accuracy predictions when the models are used to detect hate speech in manually developed datasets. However, when biased words are replaced in the data, the model’s accuracy significantly improves. The contributions of this research include the development of an automatically generated bias test dataset from the dataset created by Ibrohim dan Budi (2019), as well as a manually developed bias test dataset."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nur Indah Pratiwi
"Saat ini pengguna media sosial semakin kreatif dalam menyampaikan ujaran kebencian. Untuk menghindari peraturan kebijakan di media sosial, pengguna menggunakan kode untuk berinteraksi satu sama lain. Kode tersebut merupakan istilah atau julukan berisi kebencian yang ditargetkan pada suatu pihak untuk menyampaikan ujaran kebencian. Penelitian ini bertujuan untuk menggunakan kode kebencian dalam mengidentifikasi ujaran kebencian pada media sosial. Penelitian ini menggunakan twit berbahasa Indonesia serta menggunakan metode Logistic Regression, Support Vector Machine, Naïve Bayes, dan Random Forest Decision Tree. Hasil penelitian menunjukkan bahwa fitur kode
kebencian (hate-code HC) yang diusulkan, dapat digunakan sebagai fitur untuk identifikasi
ujaran kebencian. Jika tanpa fitur kode kebencian, F-Measure menghasilkan tidak lebih dari 55%. Namun, performa meningkat jika menggunakan fitur kode kebencian dengan hasil F-Measure sebesar 80.71% yang dikombinasikan dengan metode Logistic Regression Nowadays social media users are increasingly creative in expressing hate speech.

To avoid policy regulations on social media, users use code to interact with each other. The code is a term or nickname containing hatred that is targeted at a individual or groups to convey the utterance of hate. This study aims to use hate codes in identifying hate speech on social media. This study uses twit in Indonesian and uses the Logistic Regression, Support Vector Machine, Naïve Bayes, and Random Forest Decision Tree. The results show the hate code features (HC) that proposed can be used as a feature to identify hate speech. If without the hate code feature, F Measure generates nomore than 55%. However, performance increases if using this feature, with the result of F-Measure of 80.71%
combined with Logistic Regression method.
"
Depok: Fakultas Komputer Universitas Indonesia, 2019
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Melia Fahira Fazrine
"Untuk membantu proses pembelajaran, memperoleh informasi, dan berkomunikasi, mahasiswa membutuhkan sarana yang dapat memenuhi kebutuhan tersebut, salah satunya adalah media sosial. Namun, penggunaan media sosial memiliki dampak negatif, salah satunya yaitu munculnya ujaran kebencian. Ujaran kebencian dapat berdampak negatif bagi kondisi psikologis mahasiswa dan menurunkan kesejahteraan subjektif. Maka, penelitian ini bertujuan untuk melihat hubungan antara ujaran kebencian di media sosial dengan kesejahteraan subjektif dari dua sudut pandang, yaitu sudut pandang pelaku ujaran kebencian dan sudut pandang yang mengungkap ujaran kebencian. Sebanyak 200 mahasiswa (M=21.39, SD=1.021) berpartisipasi dalam penelitian ini. Penelitian ini menggunakan metode penelitian korelasional untuk melihat hubungan kedua variabel. Alat ukur The PERMA-Profiler untuk mengukur kesejahteraan subjektif dan alat ukur kecenderungan melakukan ujaran kebencian untuk mengukur perilaku ujaran kebencian yang digunakan dalam penelitian ini. Berdasarkan uji korelasi yang dilakukan menggunakan teknik analisis Pearson Correlation, ditemukan bahwa tidak ada hubungan positif dan signifikan antara ujaran kebencian dengan kesejahteraan subjektif dari sudut pandang pelaku (r = -0.078, p > 0.05) dan tidak ada hubungan positif dan signifikan antara kebencian berbicara dengan kesejahteraan subjektif dari sudut pandang yang terpapar (r = 0.073, p > 0.05). Artinya, ditemukan bahwa tidak ada hubungan antara ujaran kebencian dengan kesejahteraan subjektif pada mahasiswa.

To help the learning process, obtain information, and communicate, students need tools that can meet these needs, one of which is social media. However, the use of social media has a negative impact, one of which is the emergence of hate speech. Hate speech can negatively affect a student's psychological condition and degrade subjective well-being. Thus, this study aims to see the relationship between hate speech on social media and subjective welfare from two points of view, namely the point of view of the perpetrator of hate speech and the point of view that reveals hate speech. A total of 200 students (M= 21.39, SD= 1,021) participated in this study. This study used a correlational research method to see the relationship between the two variables. The PERMA-Profiler measuring instrument for measuring subjective well-being and the tendency to measure hate speech to measure hate speech behavior were used in this study. Based on the correlation test conducted using the Pearson Correlation analysis technique, it was found that there was no positive and significant relationship between hate speech and subjective well-being from the perpetrator's point of view (r = -0.078, p > 0.05) and there was no positive and significant relationship between hate speech and subjective well-being from the exposed point of view (r = 0.073, p > 0.05). Which means, it was found that there is no relationship between hate speech and subjective well-being in students."
Depok: Fakultas Psikologi Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Wiharyani
"Penyebaran konten ujaran kebencian berpotensi memunculkan kekerasan fisik dan konflik sosial. Terlepas dari meningkatnya kesadaran masyarakat terhadap dampak yang merugikan akibat ujaran kebencian di media sosial, hanya sedikit konsensus yang memusatkan perhatian pada pendekatan untuk menguranginya. Disertasi ini bertujuan merumuskan model pengendalian sosial melalui analisis pola dan efektivitas penanganan ujaran kebencian secara daring di media sosial dengan menggunakan parameter efektivitas regulasi dari Evan (1990). Berbeda dengan beberapa penelitian terdahulu, terutama di negara Barat yang fokus pada hak kebebasan berpendapat, penelitian ini mengedepankan pendekatan toleransi dalam menganalisis pengendalian terhadap ujaran kebencian secara daring di Indonesia. Melalui pendekatan kualitatif, pertanyaan penelitian dijawab dengan beberapa teknik analisis, termasuk teknik Delphi yang merumuskan konsensus dari para ahli untuk model pengendalian sosial yang efektif. Hasil yang ditemukan dari penelitian ini, antara lain; terdapat pola berbeda dalam tindakan ujaran kebencian secara daring yang dilakukan oleh individu dengan kelompok, regulasi dan penanganan kasus penyebaran ujaran kebencian secara daring selama ini tidak efektif, tidak adanya kolaborasi institusi formal dan informal dalam pengendalian ujaran kebencian, dan fokus program belum menyentuh akar masalah munculnya ujaran kebencian. Akhirnya, penelitian ini berkontribusi memberikan kebaruan terhadap model efektif dalam pengendalian sosial terhadap ujaran kebencian secara daring yang fokus pada peningkatan sosialisasi, edukasi, dan fasilitasi.

Hate speech content dissemination can lead to physical violence and social conflict. Despite heightened awareness of the deleterious impact of online hate speech, particularly on social media platforms, there is little consensus on an approach to control it. This dissertation aims to construct a model of social control through online hate speech patterns and regulation evaluation using regulatory effectiveness parameters from Evan (1990). Unlike previous studies, especially research about online hate speech in western countries that focus on the right to freedom of speech, this research promotes a tolerance-based approach in analyzing social control against online hate speech in Indonesia. Through a qualitative approach, research questions were answered by several techniques, including the Delphi method outlining the consensus from experts for an effective model of social control against online hate speech. The findings of this study are: there are differences in patterns in online hate speech carried out by individuals and groups, existing regulation and the handling of online hate speech cases has been ineffective, there is no collaboration between formal or informal institutions in controlling hate speech, and yet the focus of program has not touched the root of hate speech. Finally, this research contributes to the novelty of an effective model of social control against online hate speech, which focuses on socialization, education, and facilitation."
Depok: Fakultas Ilmu Sosial Dan Ilmu Politik Universitas Indonesia, 2023
D-pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
Arassi Alfandi
"ABSTRAK
Pada penelitian ini penulis melakukan analalisis hate spin di media sosial twitter terhadap proses Pilkada di Provinsi Jawa Barat. Pencarian data penelitian dilakukan pada media sosial Twitter, informasi tentang hate spin menjadi objek utama penelitian yang akan dikaji lebih dalam. Berdasarkan hasil penelitian ditemukan akun-akun bermuatan negatif yang berusaha menyentuh sisi emosi pengguna media sosial Twitter daripada sisi rasionalnya. Akun-akun tersebut diberi nama sama dengan pasangan calon Pilkada Jabar Tahun 2018 diantaranya adalah akun Ridwan Kamil-Uu Rhuzanul Ulum rlm; @rinduTPbenci, akun Sudrajat Ahmad Syaikhu @SudrajatAhmadS1 dan akun Deddy Mizwar Dedi Mulyadi @2dm4jabar. Dalam proses pencarian data tidak ditemukan akun yang secara khusus melabeli citra negatif pada pasangan calon nomer urut dua yaitu Tubagus Hasanudin dan Anton Charliyan. Dari hasil observasi peneliti dapat diketahui bahwa akun-akun tersebut tidak dibuat oleh kandidat untuk berkampanye melainkan akun-akun tersebut dibuat oleh propagandis untuk menyebarkan Hate Spin. Tweet propaganda yang disampaikan pada akun-akun diatas menggunakan metode gambar dan tulisan, hal ini bertujuan untuk menarik perhatian dan memudahkan dalam memberikan pengaruh kepada pengguna media sosial twitter khususnya di Jawa Barat. Terdapat 5 wacana yang dibahas dari keempat pasangan calon yaitu Agama, Dinasti Politik, Korupsi, Pelanggaran kampanye dan Kualitas Pasangan Calon Kepala daerah yang mana pada masing-masing isu ini ditemukan propaganda, partial truth dan Hate Spin. Kasus Hate Spin menjadi ancaman bagi kedaulatan rakyat Indonesia. Karena dengan adanya Hate Spin sistem pemilihan umum akan menjadi sarana bagi mereka-mereka orang yang tidak pro demokrasi untuk memenangkan salah satu kandidat pasangan calon dengan berbagai cara yang mereka kehendaki. Hal ini melunturkan marwah dari sistem demokrasi Indonesia yang mana seharusnya rakyat bebas memilih pemimpinnya melalui pemilu tanpa intervensi dari pihak manapun.

ABSTRACT
In this research, outhor did hate spin analysis on twitter towards the process of the Regional Elections in West Java Province. The searching for data conducted on twitter, the information about hate spin was being the main object of the research that would be observed deeply. Based on the results of the research found that accounts with the negative content try to touch the emosional side of Twitter rsquo s users than the rational side. Those accounts were named with the same name of the candidates of the Regional Elections Jabar in 2018 such as Ridwan Kamil Uu Rhuzanul Ulum rsquo s account rinduTPbenci, Sudrajat Ahmad Syaikhu rsquo s account SudrajatAhmadS1, and Deddy Mizwar Dedi Mulyadi rsquo s account 2dm4jabar. In the process of searching data did not find account that specially give negative image to the candidate number 2, Tubagus Hasanudin dan Anton Charliyan. From the observation of the outhor can be seen that those accounts are not made by the candidates to campaign but the accounts are made by propagandis to spread Hate Spin. The propaganda tweet delivered by those accounts using of drawing and writing method, it aims to attract attention and giving influence easily to users of Twitter, especially in West Java. There are 5 discourses that discussed from four pairs of the candidates, Religion, Political Dinasty, Coruption, Campaign Violations and the quality of the pairs of the candidates that from each of the issues found propaganda, partial truth and Hate Spin. The case of Hate Spin becomes a threat to the sovereignty of the people of Indonesian. Because of the existence of Hate Spin, the electoral system would be tools for those who are not pro democracy to win one of the pairs of the candidates in various ways that they want. This will fade the dignity of the Indonesian democratic system that the people should be free to elect their leaders through elections without any intervention from any party. Key Words Twitter, Propaganda, Partial Truth, Hate Spin, The threat of Indonesia 39 s democratic system "
2018
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Alif Mahardhika
"Ujaran kasar dan ujaran kebencian telah menjadi fenomena yang banyak ditemukan di media sosial. Penyalahgunaan kebebasan berpendapat ini berpotensi memicu terjadinya konflik dan ketidakstabilan sosial dikalangan masyarakat, baik dalam interaksi sosial secara digital maupun secara fisik. Diperlukan upaya identifikasi ujaran kasar dan ujaran kebencian secara otomatis, akurat, dan efisien untuk mempermudah penegakkan hukum oleh pihak berwenang. Penelitian pada skripsi ini melakukan perbandingan performa klasifikasi ujaran kasar dan ujaran kebencian pada data teks mixed-coded berbahasa Indonesia-Jawa, menggunakan model klasifikasi berbasis BERT. Eksperimen perbandingan dilakukan dengan membandingkan pre-trained model berbasis BERT dengan berbagai arsitektur dan jenis berbeda, yaitu BERT (dengan arsitektur base dan large), RoBERTa (arsitektur base), dan DistilBERT (arsitektur base). Untuk mengatasi keterbatasan mesin dalam memahami teks mixed-coded, penelitian ini dirancang dalam dua skenario yang membandingkan performa klasifikasi pada teks mixed-coded Indonesia-Jawa dan teks mixed coded yang diterjemahkan ke Bahasa Indonesia. Hasil terbaik berdasarkan F1-Score didapatkan pada klasifikasi menggunakan model berbasis BERT dengan nama IndoBERT-large-p2 pada kedua skenario, dengan F1-Score 78,86% pada skenario tanpa proses translasi, dan F1-Score 77,22% pada skenario dengan proses translasi ke Bahasa Indonesia.

Hateful and abusive speech has become a phenomenon that becomes common in social media. This abuse of freedom of speech presents significant risk of starting social conflicts, be it in the form of digital or physical social interactions. An accurate, efficient, and automated hate speech and abusive language identification effort needs to be developed to help authorities address this problem properly. This research conducts a comparison on hate speech and abusive language identification using several BERT-based language models. The comparisons are made using a variety of BERT-based language models with different types and architecture, including BERT (base and large architecture), RoBERTa (base architecture), and DistilBERT (base architecture). To address the mixed-coded nature of social media texts, this research was conducted under two different scenario that compares the classification performance using a mixed-coded Indonesian-Javanese text and texts that have been translated to Indonesian. The best classification output was measured using F1-Score, with a BERT-based model named IndoBERT-large-p2 outscoring the other BERT-based models in both scenario, scoring an F1-Score of 78.86% in untranslated scenario, and 72.22% F1-Score on the Indonesian-translated scenario."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Gilang Reno Prakoso
"Di Indonesia, khususnya DKI Jakarta sebagai pusatnya, ujaran kebencian khususnya dalam bentuk berita bohong menjadi sangat massif dan merebak. Polda Metro Jaya khususnya Direktorat Intelkam memiliki kewajiban melakukan deteksi dini terhadap ancaman harus berperan aktif melakukan upaya-upaya pencegahan dan antisipasi. Penelitian ini menggunakan pendekatan kualitatif. Hasil dari penelitian yaitu: (1) Momentum politik saat pilkada dan menjelang pemilihan presiden seakan menjadi momentum menyebarnya berita hoaks. Pada tahun 2018, sedikitnya ada kurang lebih 997 kasus hoaks di DKI Jakarta yang dipantau, dicegah dan ditanggulangi oleh Ditintelkam Polda Metro Jaya, melonjak drastis dari tahun-tahun sebelumnya. Dari sekian banyak jenis ujaran kebencian, yang paling banyak terjadi khususnya di DKI Jakarta sebagai “penjuru” nya Indonesia adalah berita bohong (hoaks). (2) Ditinjau dari sudut pandang Foreign policy dan Program strategy development, pemerintah telah berupaya meminimalisir terjadinya berita bohong dengan berbagai peraturan dan Undang-Undang, misalnya melalui Surat Edaran Kapolri Nomor: SE/6/X/2015 tanggal 8 Oktober 2015 tentang penanganan Ujaran Kebencian. Dari sudut pandang Economic Analysis, menjadi produsen maupun penyebar berita bohong (hoaks) kemudian mengambil keuntungan dari pro kontra yang ditimbulkan menjadi pilihan “pekerjaan” bagi sebagian orang saat ini. Dari sudut pandang political analysis, dimana justru banyak aktor-aktor politik yang memanfaatkan berita bohong dan sengaja diproduksi untuk menyingkirkan dan menjatuhkan lawan politiknya. Ditinjau dari sudut pandang Compliance monitoring bahwa dengan banyaknya fenomena berita bohong di tengah masyarakat akan berpotensi pada terjadinya konflik-konflik di dalam masyarakat yang berbahaya bagi ketahanan nasional, sehingga dari sudut Defence and security threat terlihat jika fenomena ujaran kebencian ini tidak diantisipasi sejak dini, berpotensi pada terpecah belahnya NKRI. Oleh karena itu, Law enforcement planning yang perlu dilakukan adalah memaksimalkan dan mensinergikan berbagai pemangku kepentingan di DKI Jakarta termasuk masyarakat itu sendiri dalam upaya antisipasi sejak dini terhadap berita bohong (hoaks) yang meresahkan masyarakat demi keutuhan NKRI.

In Indonesia, especially DKI Jakarta as the center, hate speech, especially in the form of fake news, has become massive and widespread. Polda Metro Jaya, especially the Directorate of Intelligence and Security, has an obligation to carry out early detection of threats and must play an active role in making prevention and anticipation efforts. This research uses a qualitative approach. The results of the research are: (1) Political momentum during the regional elections and before the presidential election seems to be a momentum for hoax news to spread. In 2018, there were at least 997 hoax cases in DKI Jakarta that were monitored, prevented and overcome by the Directorate of Information and Technology of the Polda Metro Jaya, a drastic increase from previous years. Of the many types of hate speech, the most common especially in DKI Jakarta as the “corner” of Indonesia is hoax. (2) From the point of view of the foreign policy and strategy development program, the government has tried to minimize the occurrence of fake news with various regulations and laws, for example through the Chief of Police Circular Number: SE / 6 / X / 2015 dated 8 October 2015 concerning handling of speech. Hatred. From the point of view of the Economic Analysis, being a producer or spreading hoax then taking advantage of the pros and cons that has resulted in becoming a "job" choice for some people today. From the point of view of political analysis, there are many political actors who take advantage of fake news and are deliberately produced to get rid of and overthrow their political opponents. From the point of view of Compliance monitoring, with the many phenomena of fake news in the community, there will be potential for conflicts in society that are dangerous to national security, so that from the point of view of Defense and security threat, it can be seen that if the phenomenon of hate speech is not anticipated early, it will the potential for the fragmentation of the Republic of Indonesia. Therefore, law enforcement planning that needs to be done is to maximize and synergize various stakeholders in DKI Jakarta including the community itself in an effort to anticipate from an early age fake news (hoax) that disturbs the community for the integrity of the Republic of Indonesia"
Depok: Sekolah Kajian Stratejik dan Global Universitas Indonesia, 2021
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>