Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 110286 dokumen yang sesuai dengan query
cover
Gina Kusuma
"Perbatasan negara merupakan wilayah yang rentan untuk dipengaruhi oleh negara-negara tetangga. Faktor-faktor yang dapat mempengaruhi negara seperti penyalahgunaan sumber daya alam, penyelundupan dan pencemaran lingkungan. Salah satu bahaya pencemaran lingkungan adalah berasal dari sumber radionuklida, baik dari alam maupun teknologi fasilitas nuklir. Untuk mencegah pengaruh buruk tersebut, PRFN BATAN berencana menempatkan perangkat pemantau radiasi lingkungan di berbagai wilayah perbatasan negara. Perangkat pemantau radiasi lingkungan yang tersedia saat ini hanya memiliki kemampuan untuk pengukuran nilai cacah gross radiasi tanpa kemampuan identifikasi jenis radionuklida. Kekurangan ini menyebabkan hasil yang bias ketika kondisi abnormal, apakah disebabkan oleh NORM atau TNORM. Maka, dibuatlah perangkat dengan kemampuan identifikasi radionuklida menggunakan detektor sintilasi CsI(Na) dengan metode machine learning. Pengujian dilakukan di laboratorium dengan variasi waktu pencacahan 1, 5, 10, 15, 30, 60 dan 120 menit serta jarak 50, 75, 100, 125 dan 150 cm, representasi dari laju dosis. Metode fitur ekstraksi menggunakan Histogram of Oriented Gradients (HOG) dengan 4 buah pembagian daerah sesuai dengan puncak radionuklida. Metode klasifikasi menggunakan Linear Regression, LDA, K-NN, Decision Tree, Naïve Bayes, SVM dan Neural Network. Hasil pengujian menunjukkan kombinasi metode ektraksi fitur ketiga dengan metode klasivikasi SVM merupakan metode terbaik dengan akurasi sebesar 97.845% dan waktu identifikasi radionuklida 0.997 ms.

State borders are areas that are vulnerable to being influenced by neighboring countries. Factors that can affect the country such as misuse of natural resources, smuggling and environmental pollution. One of the dangers of environmental pollution is originating from radionuclide sources, both from nature and nuclear facility technology. To prevent this bad influence, PRFN BATAN plans to place environmental radiation monitoring devices in various border areas of the country. Currently available environmental radiation monitoring devices only have the ability to measure the gross count value of radiation without the capability to identify the type of radionuclide. This deficiency causes biased results when the condition is abnormal, whether due to NORM or TNORM. So, a device with the ability to identify radionuclides was made using the CsI (Na) scintillation detector using the machine learning method. Tests were carried out in the laboratory with a variety of counting time 1, 5, 10, 15, 30, 60 and 120 minutes and distances of 50, 75, 100, 125 and 150 cm, a representation of the dose rate. The feature extraction method uses a Histogram of Oriented Gradients (HOG) with 4 regional divisions according to the radionuclide peaks. The classification method uses Linear Regression, LDA, K-NN, Decision Tree, Naïve Bayes, SVM and Neural Network. The test results show that the combination of the third feature extraction method with the SVM classification method is the best method with an accuracy of 97.845% and a radionuclide identification time of 0.997 ms."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Hendriawan Alfitodinova
"Sebuah paparan radiasi memiliki dampak yang baik dan buruk bagi kehidupan manusia, maka dari itu diperlukan alat untuk mendeteksi adanya sinar radiasi yang berbahaya atau tidak. Hal tersebut merupakan bentuk preventif dari sebuah malapetaka. Sebuah kejadian pada Chernobyl yang membuat manusia tidak bisa menghuni tempat tersebut lagi. Oleh karena itu, perlu dipelajari bahwa kejadian tersebut bisa saja tidak terjadi apabila disiapkan tindakan preventif. Salah satu hal preventif tersebut adalah dengan melakukan identifikasi radiasi dari sumber untuk menilai tingkat keselamatannya. Maka dari itu, penelitian ini dilakukan agar implementasi preventif tersebut bisa dipermudah dengan melakukan modernisasi sebuah sistem dengan menambahkan machine learning pada sebuah sistem. Hasil analisis menunjukkan kedua algoritma memiliki performa yang baik. Model CNN dengan transformasi Upscaling memiliki performa terbaik dengan akurasi sebesar 96.1%, presisi sebesar 0.963, recall sebesar 0.957, dan F1-score sebesar 0. 960.

A radiation exposure has a good and bad impact on human life, hence the need for a tool to detect the presence of harmful radiation rays or not. This is a preventive form of a catastrophe. An incident in Chernobyl that made humans unable to inhabit the place again. Therefore, it is necessary to learn that the incident could not have happened if preventive measures were prepared. One of the preventive measures is to identify the radiation from the source to assess its safety level. Therefore, this research was conducted so that the preventive implementation can be facilitated by modernizing a system by adding machine learning to a system. The analysis results show that both algorithms have good performance. CNN model with Upscaling transformation has the best performance with accuracy of 96.1%, precision of 0.963, recall of 0.957, and F1-score of 0. 960."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aldo Sultan Manneken
"Dalam pelaksanaan distribusi listrik yang dilakukan PT.”X” terhadap pelanggan PT. “X”, terdapat susut energi listrik yang terjadi baik secara teknis maupun non teknis. Susut energi listrik ini mengakibatkan kerugian yang cukup besar bagi PT.”X” setiap tahunnya. Dalam upaya untuk mengatasi dan mengurangi susut energi non teknis, PT.”X” mengadakan kegiatan P2TL dimana pada kegiatan ini, petugas P2TL akan melakukan pengecekan pada pelanggan PT.”X” yang terindikasi melakukan susut energi non teknis. Namun, dalam pelaksanaan kegiatan P2TL, PT.”X” masih melakukan proses penentuan target operasi P2TL secara manual. Untuk membantu kinerja PT.”X” dalam melakukan kegiatan P2TL, diperlukan pendekatan lain dalam melakukan penentuan target operasi P2TL. Penelitian ini akan melakukan pendekatan berbasis machine learning dengan metode supervised learning untuk melakukan deteksi pencurian tenaga listrik. Terdapat tiga algoritma yang akan digunakan dalam penelitian ini, yaitu: Naïve bayes, Naïve bayes dengan AdaBoost, dan logistic regression. Dalam penelitian ini, dataset yang digunakan adalah dataset pemakaian bulanan 423.216 pengguna listrik PT.”X” pascabayar selama 49 bulan yaitu sejak bulan Agustus tahun 2018 hingga bulan Agustus tahun 2022. Hasil penelitian ini menunjukkan rata-rata akurasi model yaitu Naïve bayes sebesar 53%, Naïve bayes dengan AdaBoost sebesar 64%, dan logistic regression sebesar 75%. Algoritma logistic regression menunjukkan performa paling baik dibandingkan dengan kedua algoritma lainnya yaitu rata-rata precision score 74%, rata-rata F1 score 59% dan rata-rata recall score adalah 60%.

In the implementation of electricity distribution carried out by PT. “X”-to-PT.”X” customers, there are losses in electrical energy that occur both technically and non-technically. This loss of electrical energy results in substantial losses for PT.”X” every year. To overcome and reduce non-technical energy losses, PT.”X” holds P2TL activities where in this activity, P2TL officers will check PT.”X” customers who are suspected of carrying out non-technical energy losses. However, in carrying out P2TL activities, PT.”X” is still carrying out the process of determining P2TL operational targets manually. To assist PT. “X”'s performance in carrying out P2TL activities, another approach is needed in determining P2TL operational targets. This research will use a machine learning-based approach using supervised learning method to detect electricity theft. There are three algorithms that will be used in this study, namely: naïve bayes, naïve bayes with AdaBoost, and logistic regression. In this study, the dataset used is the monthly usage dataset of 423,216 postpaid PT.”X” electricity users for 49 months, from August 2018 to August 2022. The results of this study show that the average accuracy of the model by naïve bayes is 53%, naïve bayes with AdaBoost is 64%, and logistic regression is 75%. The logistic regression algorithm shows the best performance compared to the other two algorithms, where the average precision score is 74%, the average F1 score is 59% and the average recall score is 60%."
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aziz Setia Aji
"ABSTRAK
Badan Meteorologi Klimatologi dan Geofisika (BMKG) memiliki tugas pengamatan terhadap magnet bumi yang tersebar di Indonesia. Sensor magnetik bumi BMKG menghasilkan output data real-time. Penelitian ini berfokus pada model predictive maintenance pada sensor magnetik bumi berdasarkan output data sensor. Output data yang dihasilkan adalah dalam bentuk format delimited-space sehingga mudah untuk diproses. Komponen magnetik yang digunakan dalam penelitian ini adalah data komponen total magnet bumi (F) dari sensor. Pemrosesan data menggunakan bahasa pemograman python dan algoritma yang digunakan adalah metode random forest regression dengan membandingkan perbedaan nilai yang dihasilkan dengan data Indoesian Geomagnetic Maps for Epoch 2015.0 untuk kemudian dibuatkan model prediksi terhadap waktu. Proses tersebut digunakan untuk mengetahui apakah data yang dihasilkan masih dalam toleransi atau tidak. Tahapan dalam penelitian ini mulai dari pengumpulan data, pre-processing data, pembuatan model, hingga pengujian model dan validasi terhadap model. Penelitian ini menghasilkan estimasi waktu pemeliharan sebesar 14 hari pada data baseline nilai F dan sebesar 3 hari pada data delta F (ΔF).

ABSTRACT
The Meteorological, Climatological, and Geophysical Agency (BMKG) has the task of observing the earth magnets spread across Indonesia. Earth magnetic sensor of BMKG delivers real-time data output. The study focuses on the predictive maintenance model on the earth's magnetic sensor based on sensor data output. The resulting data output is in the form of delimited-space format so it is easy to process. The magnetic component used in this study is data on the earth's total magnetic component (F) from the sensor. Data processing uses python programming language and the algorithm used is a random forest regression method by comparing the value difference generated with the Indoesian Geomagnetic Maps for Epoch 2015.0 data for later created predictive models against time. The process is used to determine whether the resulting data is still in tolerance or not. The stages in this study range from data collection, pre-processing data, create model, model testing, and model validation. The study resulted in a 14-day maintenance time estimate of the baseline data F-value and 3-day in the delta F (ΔF) data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Syafiq Hidayattullah
"Laporan keuangan merupakan dokumen sangat penting yang menjadi basis dari keputusan berbagai stakeholder pada pasar modal. Ironisnya, fenomena fraud (kecurangan) pada laporan keuangan perusahaan bukan merupakan praktik yang tidak pernah terjadi. Data yang dilansir ACFE Chapter Indonesia pada tahun 2016 menunjukkan bahwa sekitar 40% dari kecurangan pada laporan keuangan menyebabkan kerugian yang mencapai lebih dari Rp. 10 milyar. Menurut laporanyang dirilis oleh ACFE pada tahun 2014, rata-rata waktu yang dibutuhkan untuk
mendeteksi kecurangan pada laporan keuangan adalah 24 bulan dengan total kerugian yang bisa mencapai US$ 150.000. Penelitian ini akan menggunakan pendekatan machine learning berbasis optimasi meta-heuristic untuk mengembangkan model prediksi fraud pada laporan keuangan. Terdapat beberapa metode klasifikasi yang dapat digunakan yaitu Neural Networks dan Support Vector Machine. Hasil prediksi terbaik pada penelitian ini berupa model Support Vector Machine dengan parameter teroptimasi dengan Genetic Algorithm yang mendapatkan akurasi sebesar 96.15%.

Financial statement is a critical document which form the basis of decisions of various stakeholders in the capital market. Ironically, the phenomenon of fraud (fraud) on the company's financial statements is not a practice that never happened. Data reported by ACFE Chapter Indonesia in 2016 showed that around 40% of the financial statement caused losses that reached more than Rp 10 billion. According to a report released by ACFE in 2014, the average time needed to detect fraud on financial statements is 24 months, with a total loss that could reach US$ 150,000. This study will use several machine learning approaches based on meta-heuristic optimization to develop fraud prediction models in financial statements. Two classification methods were utilized, namely, Back Propagation Neural Networks and Support Vector Machines. The best classifier in this study is a Support Vector Machine, which parameters are optimized with Genetic Algorithm resulting in 96.15% accuracy."
Depok: Fakultas Teknik Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Pohan, Nur Wulan Adhani
"Banyaknya konferensi menyulitkan peneliti memilih konferensi berkualitas. Kemungkinan peneliti tertipu dengan konferensi predator merupakan ancaman nyata yang perlu diperhatikan. Penilaian konferensi umumnya menggunakan pakar yang membutuhkan waktu dan biaya yang tinggi. Penelitian ini fokus untuk menganalisis jika h-indeks, impact factor, jumlah dokumen, dan SJR dapat menghasilkan penilaian kualitas yang sesuai dengan penilaian manual pakar dari beberapa situs penilaian konferensi serta membandingkan hasil performanya dengan penilaian jurnal. Data yang digunakan dikumpulkan dari empat sumber situs web yang mengkalkulasi kualitas konferensi luar negeri, yaitu CORE, ERA/QUALIS, AMiner, dan ScimagoJR. Data untuk penilaian jurnal didapatkan dari Guide2Research. Variabel yang digunakan untuk penilaian adalah h-indeks, jumlah dokumen, impact factor, dan SJR. Penelitian ini menggunakan metode K-Nearest Neighbor (KNN), Support Vector Machine (SVM), Naïve Bayes, dan Decision Tree (DT). KNN menghasilkan nilai akurasi tertinggi sebesar 72,22% dan f1 score senilai 63,06% menggunakan data Qualis dengan faktor h-indeks, IF, dan SJR.

The number of conferences makes it difficult for researchers to choose quality conferences. The possibility of researchers being fooled by predatory conferences is a real threat that deserves attention. Conference assessments generally use experts who require time and money to evaluate the conferences. This study focuses on analyzing whether h-index, impact factor, number of documents, and SJR can produce quality assessments in accordance with expert manual assessments from several conference assessment sites and compare the resulting performance with journal assessments. The data used were collected from four website sources that calculate the quality of overseas conferences, namely CORE, ERA/QUALIS, AMiner, and ScimagoJR. Data for journal assessments were obtained from Guide2Research. The variables used for the assessment are h-index, number of documents, impact factor, and SJR. This research used K-Nearest Neighbor (KNN), Support Vector Machine (SVM), Naïve Bayes, and Decision Tree (DT). KNN produced the highest accuracy value of 72.22% and the f1 score of 63.06% using Qualis data with the h-index, IF, and SJR factors."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Qusyairi Ridho Saeful Fitni
"Dalam beberapa tahun terakhir, keamanan data pada sistem informasi organisasi telah menjadi perhatian serius. Banyak serangan menjadi kurang terdeteksi oleh firewall dan perangkat lunak antivirus. Untuk meningkatkan keamanan, intrusion detection systems (IDS) digunakan untuk mendeteksi serangan dalam lalu lintas jaringan. Saat ini, teknologi IDS memiliki masalah kinerja mengenai akurasi deteksi, waktu deteksi, pemberitahuan alarm palsu, dan deteksi jenis serangan baru atau belum diketahui. Beberapa studi telah menerapkan pendekatan pembelajaran mesin (machine learning) sebagai solusi, dan mendapat beberapa peningkatan. Penelitian ini menggunakan pendekatan pembelajaran ensemble (ensemble learning) yang dapat mengintegrasikan manfaat dari setiap algoritma pengklasifikasi tunggal. Pada penelitian ini, dibandingkan tujuh pengklasifikasi tunggal untuk mengidentifikasi pengklasifikasi dasar yang digunakan untuk model ensemble learning. Kemudian dataset IDS terbaru dari Canadian Institute for Cybersecurity yaitu CSE-CIC-IDS2018 digunakan untuk mengevaluasi model ensemble learning. Hasil percobaan menujukan bahwa implementasi metode ensemble learning khususnya majority voting dengan tiga algoritma dasar (gradient boosting, decision tree dan logistic regression) dapat meningkatkan nilai akurasi lebih baik dibandingkan implementasi algoritma klasifikasi tunggal, yaitu 0,988. Selanjutnya, implementasi teknik pemilihan fitur spearman-rank order correlation pada dataset CSE-CIC-IDS2018 menghasilkan 23 dari 80 fitur, dan dapat meningkatkan waktu pelatihan model, yaitu menjadi 11 menit 4 detik dibanding sebelumnya 34 menit 2 detik.

In recent years, data security in organizational information systems has become a serious concern. Many attacks are becoming less detectable by firewall and antivirus software. To improve security, intrusion detection systems (IDSs) are used to detect anomalies in network traffic. Currently, IDS technology has performance issues regarding detection accuracy, detection times, false alarm notifications, and unknown attack detection. Several studies have applied machine learning approaches as solutions. This study used an ensemble learning approach that integrates the benefits of each single classifier algorithms. We made comparisons with seven single classifiers to identify the most appropriate basic classifiers for ensemble learning. Then the latest IDS dataset from the Canadian Institute for Cybersecurity, CSE-CIC-IDS2018, was used to evaluate the ensemble learning model. The experimental results show that the implementation of the ensemble learning method, especially majority voting with three basic algorithms (gradient boosting, decision tree and logistic regression) can increase the accuracy rate better than the implementation of a single classification algorithm, which is 0.988. Furthermore, the implementation of the spearman-rank order correlation feature selection technique in the CSE-CIC-IDS2018 dataset produced 23 of the 80 features, and could increase the model training time, which was 11 minutes 4 seconds compared to 34 minutes 2 seconds before."
Depok: Fakultas Teknik Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Ibnu Rais Syukran
"Paduan super merupakan jenis paduan yang dapat mempertahankan kekuatan mekanis dan kestabilan permukaannya pada temperatur yang sangat tinggi sehingga cocok diaplikasikan pada bidang kedirgantaraan, khususnya turbin gas. Jenis paduan super yang paling banyak digunakan adalah paduan super berbasis nikel karena memiliki struktur kristal FCC yang stabil di segala temperatur. Agar dapat digunakan dalam jangka waktu yang lama, kegagalan pada paduan super berbasis nikel dapat dicegah dengan mengetahui kekuatan tarik dari paduannya. Selain itu untuk mencegah terjadinya keausan pada komponen mesin, kekerasan pada paduan super berbasis nikel juga harus diketahui. Adapun titik leleh dari paduan super berbasis nikel juga harus dapat diketahui untuk mencegah terjadinya pelunakan paduan super pada temperatur yang sangat tinggi. Biaya produksi paduan super berbasis nikel tergolong mahal, karena dibuat berdasarkan pendekatan trial and error yang memakan waktu. Pada penelitian ini, dilakukan pembuatan sebuah program yang dapat memprediksi sifat mekanis paduan super berbasis nikel menggunakan pembelajaran mesin dengan metode deep learning. Melalui pembelajaran mesin, biaya produksi paduan super berbasis nikel dapat ditekan serta mempersingkat siklus perkembangan material. Penelitian ini menghasilkan suatu program deep learning dengan jenis model regresi yang dapat memprediksi kekuatan tarik, kekerasan, dan titik leleh paduan super berbasis nikel dengan keakurasian model menurut metrik R2 sebesar 98,77% berdasarkan variasi hyperparameter yang ditetapkan sebanyak tiga hidden layer dengan dense 256, 128, 64, test size sebesar 25%, random state dengan nilai 75, batch size sebesar 32, epoch sebanyak 300, dan learning rate sebesar 0,001.

A superalloy is a type of alloy that can maintain its mechanical strength and surface stability at very high temperatures so that it is suitable for application in the aerospace field, especially in gas turbines. The most widely used type of superalloy is Ni-based superalloy because it has a stable FCC crystal structure at all temperatures. The failure of Ni-based superalloys can be prevented by knowing the tensile strength of the alloy for a longer-term used. In addition, to prevent wear on the engine components, the hardness of Ni-based superalloys must also be known. The melting point of Ni-based superalloys must also be known to prevent softening of the superalloy at very high temperatures. The production cost of Ni-based superalloys is quite expensive because they are made based on a time-consuming trial and error approach. In this research, a program is developed that can predict the mechanical properties of Ni-based superalloys using machine learning with deep learning methods. Through machine learning, the production cost of Ni-based superalloys can be reduced, and the material development cycle can be shortened. The result of this research is a deep learning program with a regression model which can predict the tensile strength, hardness, and melting point of Ni-based superalloys with a model accuracy of 98.77% according to the R2 metric based on the hyperparameter variations set as three hidden layers wi"
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Michellain Millenia Setyowardhani
"Saat ini geosaintis memasuki era big data dan pembelajaran mesin memberikan potensi besar untuk berkontribusi dalam masalah geosains (Karpatne dkk., 2017). Automasi dalam analisis fasies perlu dilakukan untuk meningkatkan keakuratan, juga mengurangi waktu dan biaya dalam kegiatan pengembangan sumur sehingga dapat meningkatkan hasil produksi. Penelitian dilakukan menggunakan data log sumur pengeboran, laporan deskripsi batuan inti, dan deskripsi petrografi di reservoir gas Lapangan X. Akumulasi gas berada di reservoir utama hasil endapan vulkaniklastik pada Formasi Pucangan. Proses pengelompokan dilakukan menggunakan algoritma K-Means dan di analisis menggunakan Cutoff Crossplot. Kemudian dilanjutkan dengan klasifikasi yang dilakukan menggunakan pembelajaran tersupervisi dengan jenis algoritmaSupport Vector Machine (SVM), Random Forest, dan Extreme Gradient Boosting (XGBoost). Lokasi penelitian berada di wilayah kerja Minarak Brantas Gas Inc (MBGI) Kabupaten Sidoarjo, Jawa Timur. Lapangan X terletak pada reservoir vulkaniklastikberumur Pleistosen dan terletak di onshore Cekungan Jawa Timur. Interval produksi berada di bagian bawah yang terendapkan di lingkungan neritik luar atau lingkungan turbiditik. Lapangan X terdiri dari empat fasies yaitu, batulempung, batulanau, batupasirvulkanik, dan batupasir karbonatan. Algoritma pembelajaran mesin yang paling baik digunakan untuk identifikasi fasies pada Lapangan X adalah RandomForest dengan hasil akurasi f1-score tertinggi, dan nilai RMSE (Root Mean Square Error) paling rendah dibandingkan kedua algoritma lain.

Geoscientists are currently entering the era of big data and machine learning provides great potential to contribute to geoscience problems (Karpatne et al., 2017). Automation in facies analysis needs to be done to increase accuracy, also reduce time and costs in well development activities so as to increase production yields. The research was conducted using drilling well log data, core rock description reports, and petrographic descriptions of gas reservoirs in Field X. Gas accumulation is in the main reservoir as a result of volcaniclastic deposits in the Pucangan Formation. The clustering process was carried out using the K-Means algorithm and analyzed using the Cutoff Crossplot. Then proceed with the classification which is carried out using supervised learning with the types of Support Vector Machine (SVM), Random Forest, and Extreme Gradient Boosting (XGBoost) algorithms. The research location is in the working area of ​​Minarak Brantas Gas Inc. (MBGI) Sidoarjo Regency, East Java. Field X is in a Pleistocene volcaniclastic reservoir and is locatedonshore in the East Java Basin. The production interval is at the bottom which is deposited in an outer neriticenvironment or a turbiditic environment. Field X consists of four facies, namely, claystone, siltstone, volcanic sandstone, and carbonate sandstone. The bestmachine learning algorithm used for faciesidentification in Field X is Random Forest with thehighest f1-score accuracy, and the lowest RMSE (RootMean Square Error) value compared to the other two algorithms.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ajeng Dwi Asti
"Ujaran kebencian dapat menyebabkan terjadinya konflik dan pembantaian di masyarakat sehingga harus segera ditangani. Indonesia memiliki lebih dari 700 bahasa daerah dengan karakteristik masing-masing. Ujaran kebencian yang ada di Indonesia juga pernah dilakukan menggunakan bahasa daerah. Media sosial Twitter paling sering digunakan dalam menyebarkan ujaran kebencian. Identifikasi target, kategori, serta level ujaran kebencian dapat membantu Polri dan Kemenkominfo dalam menentukan prioritas penanganan ujaran kebencian sehingga dapat meminimalisir dampaknya. Penelitian ini melakukan identifikasi ujaran kasar dan ujaran kebencian beserta target, kategori, dan level ujaran kebencian pada data Twitter berbahasa daerah menggunakan algoritma classical machine learning dan deep learning. Penelitian ini menggunakan data lima bahasa daerah di Indonesia dengan penutur terbanyak yaitu Jawa, Sunda, Madura, Minang, dan Musi. Pada data Bahasa Jawa performa terbaik diperoleh menggunakan algoritma Support Vector Machine (SVM) dengan transformasi data Classifier Chains (CC) serta kombinasi fitur word unigram, bigram, dan trigram dengan F1-score 70,43%. Algoritma SVM dengan transformasi data CC serta kombinasi fitur word unigram dan bigram memberikan performa terbaik pada data Bahasa Sunda dan Madura dengan masing-masing F1-score 68,79% dan 78,81%. Sementara itu, pada data Bahasa Minang dan Musi hasil terbaik diperoleh menggunakan algoritma SVM dengan transformasi data CC serta fitur word unigram dengan F1-score 83,57% dan 80,72%. Penelitian ini diharapkan dapat digunakan sebagai masukan bagi Polri dan Kemenkominfo dalam pembangunan sistem identifikasi ujaran kasar, ujaran kebencian serta target, kategori, dan level ujaran kebencian pada media sosial.

Hate speech can lead to conflict and massacres in society so it must be dealt immediately. Indonesia has more than 700 regional languages with their own characteristics. Hate speech in Indonesia has also been carried out using regional languages. Twitter is the most frequently used social media to spread hate speech. Identification of targets, categories, and levels of hate speech can help the National Police and the Ministry of Communication and Information to determine priorities for handling hate speech to minimize its impact. This study identifies abusive speech and hate speech along with the target, category, and level of hate speech on regional language Twitter data using classical machine learning and deep learning algorithms. This study uses data from five regional languages in Indonesia with the most speakers, namely Javanese, Sundanese, Madurese, Minang, and Musi. In Java language data, the best performance is obtained using the Support Vector Machine (SVM) algorithm with Classifier Chains (CC) data transformation and a combination of unigram, bigram, and trigram word features with an F1-score of 70.43%. The SVM algorithm with CC data transformation and the combination of unigram and bigram word features provides the best performance on Sundanese and Madurese data with F1-scores of 68.79% and 78.81%, respectively. Meanwhile, in Minang and Musi language data, the best results were obtained using the SVM algorithm with CC data transformation and word unigram features with F1-scores of 83.57% and 80.72%, respectively. This research is expected to be used as input for the National Police and the Ministry of Communication and Information in developing a system for identifying harsh speech, hate speech and the target, category, and level of hate speech on social media."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>