Hasil Pencarian

Ditemukan 9 dokumen yang sesuai dengan query

Dennis Febri Dien

Klasifikasi multi label aritmia pada data 12-lead Elektrokardiogram menggunakan 1DCNN dan LSTM = Arrhythmia multi-label classification from 12-lead Electrocardiogram with 1DCNN and LSTM

"Penyakit jantung menjadi permasalahan utama di dunia medis. Hal ini dikarenakan sulitnya mendeteksi gejala awal dari penyakit tersebut. Pendeteksian gejala ini dapat dilakukan dengan memonitori sinyal elektrokardiogram pasien untuk mendeteksi jenis aritmia yang diderita. Penelitian klasifikasi aritmia mengunakan pemrosesan komputer telah berhasil mengidentifikasi tipe aritimia satu dengan lainnya. Namun dalam permasalahan dunia nyata, pasien dapat menderita jenis aritmia yang merupakan gabungan dari jenis aritmia lainnya. Penelitian ini bertujuan untuk melakukan klasifikasi aritmia secara multi-label pada data elektrokardiogram. Data yang digunakan adalah data yang berasal dari The China Physiological Signal Challenge 2018. Eksperimen yang dilakukan terbagi menjadi dua proses, yaitu pemilihan dan pemelajaran data. Teknik yang digunakan untuk pemilihan data dengan memotong data berdasarkan letak QRS sinyal menggunakan Combined Adaptive Threshold. Kemudian hasil data segmentasi sinyal dipelajari menggunakan 1DCNN dan LSTM dengan Attention. Penelitian ini berhasil melakukan klasifikasi multi-label pada data aritmia dan memperoleh rata-rata F1-Score sebesar 81.7% berdasarkan hasil evaluasi terbaik menggunakan K-Cross Validation.

Heart Disease is the main problem in medical world. One of the reasons is because the disease is still hard to detect it earlier. The main method to detect the heart disease is monitoring electrocardiogram signal and try to identify arrhythmia of the patient. The latest research has succeeded to classify the arrhythmia using deep learning. But in the real-world problem, patient can be having a multiple arrhythmia at the same time. This research focus on to classify multiple arrhythmia with electrocardiogram data. The data that had been used for this research is from The China Physiological Signal Challenge 2018. The experiment had two step process, there are sampling step, and learning step. Technique that had been used for sampling is based on slicing the data using QRS detection based on Combined Adaptive Threshold. Then the result of the segmentation is used for training data in 1DCNN and LSTM with attention This research has succeeded to get average of F1- Score 81.7% based on the best evaluation result using K-Cross Validation."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Muhammad Okky Ibrohim

Klasifikasi multi label untuk identifikasi ujaran kebencian dan ujaran kasar pada Twitter berbahasa Indonesia = Multi-label classification to identify hate speech and abusive language on Indonesian Twitter

"ABSTRAK

Penyebaran ujaran kebencian dan ujaran kasar di media sosial merupakan hal yang harus diidentifikasi secara otomatis untuk mencegah terjadinya konflik masyarakat. Selain itu, ujaran kebencian mempunyai target, golongan, dan tingkat tersendiri yang juga perlu diidentifikasi untuk membantu pihak berwenang dalam memprioritaskan kasus ujaran kebencian yang harus segera ditangani. Tesis ini membahas klasifikasi teks multi label untuk mengidentifikasi ujaran kasar dan ujaran kebencian disertai identifikasi target, golongan, dan tingkatan ujaran kebencian pada Twitter berbahasa Indonesia. Permasalahan ini diselesaikan menggunakan pendekatan machine learning menggunakan algoritma klasifikasi Support Vector Machine (SVM), NaÃ¯ve Bayes (NB), dan Random Forest Decision Tree (RFDT) dengan metode transformasi data Binary Relevance (BR), Label Power-set (LP), dan Classifier Chains (CC). Jenis fitur yang digunakan antara lain fitur frekuensi term (word n-grams dan character n-grams), fitur ortografi (tanda seru, tanda tanya, huruf besar/kapital, dan huruf kecil), dan fitur leksikon (leksikon sentimen negatif, leksikon sentimen positif, dan leksikon kasar). Hasil eksperimen menunjukkan bahwa secara umum algoritma klasifikasi RFDT dengan metode transformasi LP memberikan akurasi yang terbaik dengan waktu komputasi yang cepat. Algoritma klasifikasi RFDT dengan metode transformasi LP menggunakan fitur word unigram memberikan akurasi sebesar 66,16%. Jika hanya mengidentifikasi ujaran kasar dan ujaran kebencian (tanpa disertai identifikasi target, golongan, dan tingkatan ujaran kebencian), algoritma klasifikasi RFDT dengan metode transformasi LP menggunakan gabungan fitur word unigram, character quadgrams, leksikon sentimen positif, dan leksikon kasar mampu memberikan akurasi sebesar 77,36%.

Hate speech and abusive language spreading on social media needs to be identified automatically to avoid conflict between citizen. Moreover, hate speech has target, criteria, and level that also needs to be identified to help the authority in prioritizing hate speech which must be addressed immediately. This thesis discusses multi-label text classification to identify abusive and hate speech including the target, category, and level of hate speech in Indonesian Twitter. This problem was done using machine learning approach with Support Vector Machine (SVM), NaÃ¯ve Bayes (NB), and Random Forest Decision Tree (RFDT) classifier and Binary Relevance (BR), Label Power-set (LP), and Classifier Chains (CC) as data transformation method. The features that used are term frequency (word n-grams and character n-grams), ortography (exclamation mark, question mark, uppercase, lowercase), and lexicon features (negative sentiment lexicon, positif sentiment lexicon, and abusive lexicon). The experiment results show that in general RFDT classifier using LP as the transformation method gives the best accuracy with fast computational time. RFDT classifier with LP transformation using word unigram feature give 66.16% of accuracy. If only for identifying abusive language and hate speech (without identifying the target, criteria, and level of hate speech), RFDT classifier with LP transformation using combined fitur word unigram, character quadgrams, positive sentiment lexicon, and abusive lexicon can gives 77,36% of accuracy.

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019

T52442

UI - Tesis Membership Universitas Indonesia Library

Andi Suciati

Analisis Sentimen Berbasis Aspek dan Deteksi Emosi untuk Ulasan dengan Bahasa Code-mixed = Aspect-based Sentiment Analysis and Emotion Detection for Code-mixed Review

"Ulasan dapat mempengaruhi orang-orang dalam mengambil keputusan karena orang-orang dapat mengetahui ulasan yang diberikan merupakan ulasan positif atau negatif. Namun, sentimen positif, negatif, atau netral, tanpa mempertimbangkan emosi yang ada dianggap kurang, karena emosi dapat memperkuat hasil sentimen. Tesis ini membahas perbandingan antara machine learning dan deep learning dalam mengklasifikasikan sentimen dan emosi pada ulasan dengan metode klasifikasi multi-label. Pada perbandingan machine learning, digunakan metode transformasi masalah Label Powerset (LP), Binary Relevance (BR), dan Classifier Chain (CC), serta algoritma Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), dan Extra Tree Classifier (ET). Fitur yang dibandingkan yaitu n-gram language model (unigram, bigram, unigram-bigram). Untuk deep learning, algoritma yang dibandingkan yaitu Gated Recurrent Unit (GRU) dan Bidirectional Long Short-Term Memory (BiLSTM), menggunakan word embedding yang dibangun sendiri. Hasil perbandingan menunjukkan bahwa RF unggul dengan nilai F1-score 88.4% dan 89.54% dengan metode CC untuk aspek makanan, dan LP untuk harga. Untuk aspek pelayanan dan suasana, ET memimpin dengan 92.65% dan 87.1% dengan metode LP dan CC berturut-turut. Sedangkan pada perbandingan deep learning, GRU dan BiLSTM mendapatkan nilai F1-score yang sama untuk aspek makanan, 88.16%. Pada aspek harga, GRU memimpin dengan 83.01%. Namun untuk pelayanan, dan suasana, BiLSTM mendapatkan nilai lebih tinggi dengan F1-score.

Review can affect the decision making from people because people can know whether the review is positive, or negative. However, the sentimen positive, neagtive, and neutral, without considering the emotion is considered not enough because emotion can strenghten the sentimen result. This thesis explaining about the comparison of machine learning and deep learning in sentiment as well as emotion classification with multi-label classification. In machine learning comparion, the problem transformation that were used are Label Powerset (LP), Binary Relevance (BR), and Classifier Chain (CC), with Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), and Extra Tree Classifier (ET) as algorithms. The features that compared are yaitu n-gram language model (unigram, bigram, unigram-bigram). For deep learning, algorithms that were compared are Gated Recurrent Unit (GRU) and Bidirectional Long Short-Term Memory (BiLSTM), using self-developed word embedding. The comparion results RF dominates with F1-score 88.4% and 89.54% with CC method for food aspect, and LP for price. For service and ambience aspect, ET leads with 92.65% and 87.1% with LP and CC methods, respectively. On the other hand, in deep learning comparison, GRU and BiLSTM obtained similar F1- score for food aspect, 88.16%. On price aspect, GRU leads 83.01%. However, for service and ambience BiLSTM obtained higher F1-score 89.03% and 84.78%"

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Nadina Adelia Indrawan

Klasifikasi dan pengukuran sentimen ulasan pengguna pada Google Play Store = What users want for gig economy platforms: Sentiment analysis approach

"Platform digital, termasuk aplikasi mobile, mempunyai peran penting dalam gig

economy, yaitu sebagai media gig worker dalam berinteraksi dengan penyedia layanan

tenaga kerja. Aplikasi mobile berbasis gig economy semakin diminati masyarakat.

Peningkatan jumlah pengguna mengakibatkan meningkatnya jumlah unduhan dan ulasan

yang diberikan. Namun, semakin banyak ulasan menyulitkan pengembang dalam

memahami informasi yang terdapat dalam ulasan. Selain itu, satu ulasan dapat memiliki

berbagai informasi. Untuk mengatasi masalah tersebut, penelitian ini mengusulkan model

yang dapat mengkategorikan konten dan sentimen ulasan menggunakan teknik

pembelajaran mesin. Algoritme Support Vector Machine (SVM), Multinomial Naïve

Bayes, Complement Naïve Bayes, Binary Relevance, Classifier Chain, dan Label power

set digunakan pada penelitian ini. Hasil dari penelitian didapatkan algoritme SVM

sebagai algoritme terbaik, baik pada klasifikasi sentimen ulasan maupun kategorisasi

ulasan.

Digital platforms, including mobile applications, have an important role in gig economy,
as a gig worker platform in interacting with labor service providers. Gig economy based
mobile applications are increasingly in demand by the public. An increase in the number
of users results in an increase in the number of downloads and reviews provided.
However, the number of reviews makes it difficult for developers to understand the
information contained in reviews. In addition, one review can have a variety of
information. To overcome this problem, this study proposes a model that can categorize
content and sentiment reviews using machine learning techniques. Support Vector
Machine (SVM), Multinomial Naïve Bayes, Complement Naïve Bayes, Binary
Relevance, Classifier Chain, and Label power sets were used in this study. The results of
the study obtained the SVM algorithm as the best algorithm, both in the classification of
sentiment reviews and review categorization."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020

TA-pdf

UI - Tugas Akhir Universitas Indonesia Library

Deden Ade Nurdeni

Penggalian Informasi Untuk Identifikasi Permintaan Bantuan Korban Bencana Alam Menggunakan Data Twitter = Extracting Information to Identify Assistance for Natural Disaster Victims Using Twitter Data

"Kajian risiko bencana di Indonesia oleh BNPB menunjukkan jumlah jiwa terpapar risiko bencana tersebar di seluruh Indonesia dengan total potensi jiwa terpapar lebih dari 255 juta jiwa. Hasil kajian ini menunjukkan bahwa dampak bencana di Indonesia terbilang sangat tinggi. Sistem penanggulangan khususnya pada masa tanggap darurat menjadi hal yang krusial untuk dapat meminimalisir risiko. Namun, pemberian bantuan kepada korban bencana terkendala beberapa hal, antara lain keterlambatan dalam penyaluran, kurangnya informasi lokasi korban, dan distribusi bantuan yang tidak merata. Untuk memberikan informasi yang cepat dan tepat, BNPB telah membangun beberapa sistem informasi seperti DIBI, InAware, Geospasial, Petabencana.id dan InaRisk. Akan tetapi tidak secara realtime menampilkan wilayah terdampak bencana dengan memnunjukkan jenis kebutuhan bantuan apa yang dibutuhkan korban pada saat itu. Untuk memberikan solusi atas permasalah tersebut, penelitian ini membangun model yang mampu mengklasifikasikan data teks dari Twitter terkait bencana kedalam jenis bantuan yang diminta oleh korban bencana secara realtime. Selain itu visualisasi berupa dashboard dibangun dalam bentuk aplikasi berbasis peta untuk menampilkan lokasi korban yang terdampak. Penelitian ini mengunakan teknik text mining mengolah data Twitter dengan pendekatan metode klasifikasi multi label dan ekstraksi informasi lokasi menggunakan metode Stanford NER. Algoritme yang digunakan adalan Naive Bayes, Support Vector Machine, dan Logistic Regression dengan kombinasi metode tranformasi data multi label OneVsRest, Binary Relevance, Label Power-set, dan Classifier Chain. Representasi teks menggunakan N-Grams dengan pembobotan TF-IDF. Model terbaik untuk klasifikasi multi label pada penelitian ini adalah kombinasi Support Vector Machine dan Clasifier Chain dengan fitur UniGram+BiGram dengan nilai precision 82%, recall 70%, dan F1-score 75%. Stanford NER menghasilkan F1-score 83% untuk klasifikasi lokasi yang menjadi masukan untuk teknik geocoding. Hasil geocoding berupa informasi spasial ditampilkan dalam bentuk dashboard berbasis peta.

The study of disaster risk in Indonesia by BNPB shows the number of people exposed to disaster risk throughout Indonesia with a total potential life of 255 million people. The results of this study indicate that the impact of disasters in Indonesia is quite high. The response system, especially during the emergency response period, is crucial to be able to minimize risks. However, providing assistance to disaster victims is hampered by several things, including delays in providing assistance, lack of information on the location of victims, and uneven distribution of aid. To provide fast and accurate information, BNPB has built several information systems such as DIBI, InAware, Geospatial, Petabencana.id and InaRisk. However, it does not display the disaster area in real-time by showing what kind of assistance needs the victim needs at that time. To provide a solution to these problems, this study builds a model that is able to classify text data from Twitter related to the type of assistance requested by disaster victims in real-time. In addition, a dashboard is built in the form of a map-based application to display the location of the realized victim. This study uses text mining techniques to process Twitter data with a multi-label classification approach and location information extraction using the Stanford NER method. The algorithms used are Naive Bayes, Support Vector Machine, and Logistic Regression with a combination of OneVsRest, Binary Relevance, Power-set Label, and Classifier Chain. Text representation using N-Grams with TF-IDF weighting. The best model for multi-label classification in this study is a combination of Support Vector Machine and Classifier Chain with UniGram+BiGram features with 82% precision, 70% recall, and 75% F1-score. Stanford NER produces an F1-score of 83% for location classification which is the input for geocoding techniques. Geocoding results in the form of spatial information are displayed in a map-based dashboard."

Jakarta: Fakultas Ilmu Komputer Universitas Indonesia, 2021

TA-pdf

UI - Tugas Akhir Universitas Indonesia Library

Deden Ade Nurdeni

Penggalian informasi untuk identifikasi permintaan bantuan korban bencana alam menggunakan data twitter = Extracting information to identify assistance for natural disaster victims using twitter data.

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021

TA-pdf

UI - Tugas Akhir Universitas Indonesia Library

Nadhira Tasya

Klasifikasi artikel media daring Indonesia sebagai basis penempatan iklan menggunakan pendekatan text mining = Classification of Indonesian online articles as advertisement placement base using text mining approach

"Seiring dengan perkembangan teknologi yang semakin pesat, semakin berkembang pula tingkat kebutuhan manuasia akan berita terkini, sehinga muncullah sebuah tren baru yaitu mempublikasi dan mengakses berita melalui media daring atau jurnalisme daring. Selain itu, jumlah masyarakat yang melakukan jual beli daring juga terus meningkat dan peluang ini dimanfaatkan oleh perusahaan dan pihak pengiklan dengan menerapkan strategi Targeted Web Advertising. Namun tingginya jumlah artikel yang telah di publikasi dan diakses membuka peluang yang besar untuk terjadinya kesalahan dalam penentuan tempat peletakan iklan. Oleh karena itu, dibutuhkan sistem yang dapat mengkategorisasikan artikel yang diakses pengguna sebagai basis penempatan iklan oleh perusahaan dan sistem pengklasifikasian ini dapat dilakukan dengan menerapkan metode Data Mining dan Text Mining. Penelitian ini menggunakan dokumen data berupa konten artikel yang akan dikategorikan ke dalam dua puluh kategori kelas iklan dengan menggunakan teknik Text Mining dengan algoritma Support Vector Machine. Hasil dari penelitian ini dapat digunakan oleh perusahaan atau pihak pengiklan sebagai basis penempatan iklan di situs media daring yang dipilih.

Rapid increase development in technological aspect resulting in growing level of human needs for the latest news, so that emerged a new trend of publishing and accessing news through online media or called online journalism. In addition, the number of people who sell and purchase through online sites also continues to increase and this opportunity is utilized by the company and the advertiser by implementing targeted web advertising. However, the high number of articles that have been published and accessed leads to great opportunities for errors in determining where to place the ads. Therefore, it needs a system that can categorize articles accessed by users as the basis of advertisement placement by the company and this classification system can be done by applying the method of Data Mining and Text Mining. This research uses document data in the form of article content that will be categorized into twenty categories of the class of advertisement by using Text Mining technique with Support Vector Machine algorithm. The results of this study may be used by companies or advertisers as a basis for placement of ads on selected online media sites."

Depok: Universitas Indonesia, 2017

S67209

UI - Skripsi Membership Universitas Indonesia Library

Fairuz Astari Devianty

Ekspansi Data Menggunakan Forward-Backward Translation untuk Deteksi Ujaran Kebencian Multi-Label dalam Bahasa Indonesia = Data Expansion Using Forward-Backward Translation for Multi-Label Hate Speech Detection in Bahasa Indonesia

"Dengan tumbuh dan berkembangnya platform media sosial, komunikasi bisa menjadi lebih mudah dilakukan. Namun, hal tersebut dapat disalahgunakan, seperti penyebaran hate speech melalui media sosial yang semakin marak terjadi. Meski kebebasan berekspresi adalah hak setiap orang di Indonesia, namun karena dampak negatifnya konten kebencian harus dihilangkan. Salah satu solusinya adalah dengan membangun sebuah model yang dapat mendeteksi hate speech secara otomatis. Untuk membangun model pendeteksian hate speech yang baik, dibutuhkan data beranotasi dengan jumlah yang besar untuk melatih model. Selain itu perlu juga diperhatikan target dan kategori dari hate speech tersebut. Namun, saat ini hanya ada satu multi-label hate speech dataset Bahasa Indonesia yang tersedia dan memiliki kekurangan proposi data dari setiap label yang tidak seimbang. Untuk mengatasi masalah kekurangan data ini, penulis mengusulkan sebuah metode yaitu Forward-Backward Translation untuk menghasilkan data secara otomatis. Metode ini merupakan gabungan dari forward translation dan back-translation. Forward translation dilakukan pada dataset dari high-resource language dan back-translation dilakukan pada dataset dari low-resource language. Dengan digabungkannya kedua proses ini dataset yang dihasilkan akan memiliki jumlah yang besar dan memiliki kualitas terjemahan yang baik. Metode ini digunakan untuk menambahkan data pada deteksi multi-label hate speech Bahasa Indonesia dengan tambahan data dari Bahasa Inggris. Performa pendeteksian multi-label hate speech pada dataset baru hasil penelitian ini berhasil meningkat bila dibandingkan dengan pada dataset hate speech Bahasa Indonesia yang sudah ada. Dataset ini mendapatkan F1-score sebesar 0.76 saat melakukan multi-label classification dan F1-score sebesar 0.78 saat melakukan hierarchical classification.

The growth and development of social media platforms make communication easier. However, this can be misused. For example, the spread of hate speech via social media is increasing. Freedom of speech is everyone's right in Indonesia, but malicious content must be eliminated due to its negative impact. One solution is to build a model that can automatically detect hate speech. Building a good hate speech detection model requires a large amount of annotated data to train the model. It is also necessary to pay attention to the target, category, and level of hate speech. However, there is currently only one multi-label hate speech dataset in Bahasa Indonesia available and the proportion of data for each label is unequal. To overcome this data scarcity problem, we propose a forward-backward translation method to generate data automatically. This method combines forward and backward translation. A forward translation is performed for dataset in high-resource languages and a backward translation is performed for dataset in low-resource languages. By combining these two processes, the resulting dataset will have a large amount of data and good translation quality. This method will be used to add data on multi-label hate speech detection in Bahasa Indonesia with additional data from English. As a result of this study, the performance of multi-label hate speech detection in the new dataset improved compared to the existing Bahasa Indonesia hate speech dataset. This dataset gets an F1-score of 0.76 for multi-label classification and an F1-score of 0.78 for hierarchical classification."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Surya Yehezki

Klasifikasi keputusan pembelian berdasarkan pola akses pengguna situs web e-commerce dengan menggunakan web usage mining = Classification of purchase decision based on user access pattern in e-commerce website using web usage mining

"Meningkatnya penggunaan internet di Indonesia memberikan dampak positif bagi perkembangan e-commerce di Indonesia dengan jumlah pengguna internet telah melakukan transaksi elektronik sebesar 63,5 . Dengan meningkatnya jumlah e-commerce B2C di Indonesia, diperlukannya strategi promosi yang tepat untuk mengetahui preferensi dan potensi pembelian untuk setiap konsumen sehingga dapat meningkatkan transaksi e-commerce tersebut. Web usage mining merupakan salah satu metode yang dapat mengolah data web log pengguna situs web e-commerce B2C menjadi informasi yang dapat digunakan untuk mengklasifikasi keputusan pembelian pengguna situs web.

Kombinasi kategori produk pembelian yang tinggi oleh pengguna situs web e-commerce memerlukan teknik klasifikasi multi label yang dapat mengklasifikasi kombinasi pembelian secara bersamaan. Metode Label Powerset dengan algoritme Support Vector Machine SVM digunakan untuk mengklasifikasi keputusan pembelian pengguna situs web e-commerce. Seleksi fitur menggunakan Information Gain dan pemilihan parameter dengan menggunakan Grid Search terbukti dapat meningkatkan akurasi klasifikasi.

The advance of internet usage in Indonesia has a positive impact on the development of e commerce in Indonesia where 63.5 of internet users have made online transactions. Along with e commerce B2C growth in Indonesia, it is necessary for an effective promotional strategy to know the preferences and potential purchases for each consumer with the result that to increase transactions. Web usage mining is a method having an ability to convert web log data into information used for purchase classification.
The high combination of purchasing product categories by users of e commerce website required a multi label classification technique that could classify those combinations. Label Powerset method with Support Vector Machine SVM algorithm was applied to classify e commerce users purchases decision. The proposed feature selection with Information Gain and parameter selection using Grid Search could prove that they had an ability to enhance classification accuracy."

Depok: Fakultas Teknik Universitas Indonesia, 2017

S67081

UI - Skripsi Membership Universitas Indonesia Library

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian