Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 138842 dokumen yang sesuai dengan query
cover
Puspa Eosina Hosen
"Pemodelan dinamis merupakan penyederhanaan fenomena yang terjadi di alam dengan melibatkan berbagai faktor empiris. Dalam sejarah dunia, pandemi merupakan salah satu fenomena yang menimbulkan kerugian. Merebaknya pandemi COVID-19 di awal tahun 2020 dengan cepat dengan tingkat kematian yang relatif tinggi, menjadi topik baru dan hangat dalam dunia penelitian, khususnya dalam pencarian model prediksi. Berbagai model penyebaran pun dikembangkan. Gap penelitian yang dapat diidentifikasi, antara lain pertimbangan faktor spasial dalam pengembangan model prediksi penyebaran COVID-19 dan; penggunaan teknik machine learning/deep learning. Tujuan studi ini adalah mendapatkan model prediksi penyebaran penyakit menggunakan teknik machine learning/deep learning yang melibatkan faktor spasial untuk diterapkan pada kasus COVID-19. Model matematis Susceptibles–Infected–Recovered–Deaths (SIRD) dipilih sebagai dasar pengembangan model. Metode yang digunakan dalam membangun model yang melibatkan faktor spasial adalah Cellular Automata (CA). Adapun metode Long Short Term Memory (LSTM) dengan strategi Multiple Parallel Input Multi-Step Output pada arsitektur Stacked-LSTM digunakan untuk menyelesaikan model. Kontribusi studi adalah menghasilkan rumusan matematis untuk faktor spasial pada model penyebaran penyakit, serta modifikasi terhadap konsep CA yang menghasilkan model ”Gabungan Non-uniform Continuous Cellular Automata (N-CCA) dan Stacked-LSTM”. Keakuratan model yang diusulkan, diberikan oleh nilai RMSPE dan MAPE, masing-masing sekitar 8% dan 7%, untuk prediksi COVID-19 di USA selama 21 hari ke depan, dan 4% dan 3% untuk tujuh hari prediksi di Indonesia.

Dynamic modeling is a simplification of naturally occurring phenomena. Pandemics are one of the phenomena that cause losses. The outbreak of the COVID-19 pandemic in early 2020 has become a new and hot topic of research, especially in modeling disease spread. This outbreak spread rapidly and had a relatively high mortality rate. Various deployment models begin to develop. Gaps in the research results can also be identified, among others considering spatial factors on the predictive models using machine learning for the spread of COVID-19. The purpose of the studies is to obtain the formula and the predictive of disease spreads spatial model using machine learning and apply it to COVID-19 cases. A model is built using Cellular Automata (CA) configuration based on the Susceptibles–Infected–Recovered–Deaths (SIRD) model and its completion with the Long-short-term memory (LSTM) method. Multiple-parallel input multi-step output strategies are chosen on the Stacked-LSTM architecture to complete a model. The contributions of this study are the mathematical formulation for the spatial factors of the disease spread model and, as well as modifications to the CA concept. The final model was named ”A Combined Non-uniform Continuous Cellular Automata (N-CCA) Modification and Stacked-LSTM Model.” The accuracy of the proposed model, given by RMSPE and MAPE values, which is around 8% and 7%, respectively, for predictions of COVID-19 in the USA for the next 21-days, and 4% and 3% for seven days predictions in Indonesia."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
D-pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
Maranatha Florensia Wijaya
"Analisis sentimen merupakan bidang studi yang menganalisis pendapat seseorang terhadap suatu entitas untuk mencari polaritas sentimennya. Potensi manfaat yang besar didukung dengan ketersediaan data teks beropini yang melimpah di internet memicu dikembangkannya model yang mampu melakukan analisis sentimen secara otomatis dan seakurat mungkin. Dua diantaranya adalah Long Short-Term Memory (LSTM) dan Convolutional Neural Network (CNN) yang merupakan arsitektur deep learning. LSTM digunakan karena dapat menangkap aliran informasi pada kalimat, sedangkan CNN digunakan karena kemampuannya dalam mengekstrak fitur penting dari tiap penggalan kalimat atau region. Kedua model ini dapat digabungkan menjadi model gabungan LSTM-CNN yang telah terbukti mampu meningkatkan akurasi model. Penelitian ini kemudian akan mengajukan modifikasi pada model gabungan LSTM-CNN dengan mengganti LSTM menjadi Bidirectional LSTM (BiLSTM) dan CNN menjadi CNN Multi Region Size CNNMRS sehingga terbentuk tiga model modifikasi yaitu BiLSTM-CNN, LSTM-CNNMRS, dan BiLSTM-CNNMRS. Implementasi model, baik untuk model gabungan LSTM-CNN standar maupun model modifikasi, dilakukan pada data tweets berbahasa Indonesia. Hasilnya, didapatkan kesimpulan bahwa penggunaan BiLSTM untuk menggantikan LSTM pada model gabungan LSTM CNN tidak meningkatkan akurasi dari model. Hal berbeda didapatkan dari penggunaan CNNMRS untuk menggantikan CNN yang memberikan peningkatan akurasi pada model."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Farhatun Nurhaniifah
"Analisis sentimen dilakukan untuk menganalisis pendapat atau pandangan seseorang terhadap suatu masalah tertentu. Analisis sentimen dapat dilakukan secara manual, tetapi jika menggunakan data berskala besar akan lebih mudah dilakukan secara otomatis yaitu dengan menggunakan machine learning. Namun, machine learning hanya efektif digunakan pada satu domain saja sehingga dikembangkanlah lifelong learning. Lifelong learning merupakan machine learning yang dapat melakukan pembelajaran secara berkelanjutan. Pada penelitian ini, model yang digunakan adalah model CNN-LSTM dan LSTM-CNN. Pada kinerja transfer of knowledge, model CNN-LSTM dan LSTM-CNN menunjukkan hasil lebih baik dibanding model LSTM, tetapi kedua model gabungan tersebut kinerjanya lebih buruk dibanding model CNN. Sedangkan, pada kinerja loss of knowledge, model model CNN-LSTM dan LSTM-CNN menunjukkan hasil lebih baik dibanding model CNN, tetapi lebih buruk dibanding model LSTM. Pada penelitian ini, diimplementasikan juga lifelong learning dengan pembaruan vocabulary. Penambahan pembaruan vocabulary pada lifelong learning meningkatkan kinerja model CNN, LSTM, CNN-LSTM, dan LSTM-CNN pada transfer of knowledge dan loss of knowledge

Sentiment analysis is done to analyze a person's opinion or views on a particular problem. Sentiment analysis can be done manually, but if you use large-scale data it will be easier to do it automatically by using machine learning. However, machine learning is only effective in one domain, so lifelong learning is developed. Lifelong learning is machine learning that can carry out continuous learning. In this study, the models used are the CNN-LSTM and LSTM-CNN models. In the transfer of knowledge performance, the CNN-LSTM and LSTM-CNN models showed better results than the LSTM model, but the two combined models performed worse than the CNN model. Meanwhile, for the loss of knowledge performance, the CNN-LSTM and LSTM-CNN models showed better results than the CNN model, but worse than the LSTM model. In this study, lifelong learning with vocabulary updates was also implemented. The addition of vocabulary updates to lifelong learning improves the performance of the CNN, LSTM, CNN-LSTM, and LSTM-CNN models on transfer of knowledge and loss of knowledge"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ferdiansyah Zhultriza
"Turbin gas di Pembangkit Listrik Tenaga Gas dan Uap (PLTGU) harus dijaga keandalannya dengan melakukan prediksi anomali untuk menghindari kerusakan turbin gas. Untuk melakukan prediksi anomali turbin gas, perlu menggunakan metode yang tepat dengan memperhatikan beberapa hal. Prediksi anomali pada real-performance turbin gas di pembangkit listrik sulit dilakukan dengan simulasi model fisik karena kondisinya yang dinamis dan banyaknya parameter operasi yang saling memiliki korelasi, sehingga, dibutuhkan metode yang memiliki kemampuan ekstrasi informasi input dengan baik. Selain itu, parameter operasi turbin gas juga memiliki sifat sekuensi waktu, dimana hubungan parameter sebelum dan sesudah waktu tertentu memiliki hubungan yang berkorelasi. Beberapa penelitian belum dapat mengatasi kedua permasalahan tersebut untuk pemodelan real-performance turbin gas. Metode Convolutinal Neural Network dapat digunakan untuk menjawab permasalahan pertama dan metode Recurrent Neural Network dapat menjawab permasalahan kedua. Oleh karena itu, penelitian ini mengajukan metode hybrid Convolutional Neural Network (CNN) dengan tipe dari Recurrent Neural Network (RNN), yakni Long Short-term Memory (LSTM) dan Gate Recurrent Unit (GRU), untuk dapat mengekstrasi korelasi hubungan antar-parameter yang tepat dengan kemampuan komputasi time variant yang baik. Prediksi anomali yang didapatkan menggunakan model CNN sebesar 81,33%, metode hybrid CNN-LSTM sebesar 91,79%, dan hybrid CNN-GRU sebesar 91,46%. Sehingga, hybrid CNN-LSTM memberikan peningkatan akurasi prediksi anomali turbin gas dengan kemampuan ekstrasi fitur parameter dan komputasi time-variant yang lebih baik.

The reliability of the gas turbine in Combined Cycle Power Plant (CCPP) should be maintained by predicting anomalies to avoid damage failure. To predict the gas turbine anomaly, it is necessary to use the right method by paying attention to several things. The operating parameters of the gas turbine system are a form of inter-parameter correlation with a high dynamic change correlation, so it requires a method that can extract the feature input between parameters correctly. In addition, the gas turbine operating parameters also have time sequence properties, where the correlation between parameters before and after a certain time has a correlated variant. Several studies have not been able to overcome these two problems for modeling real-performance gas turbines. The Convolutional Neural Network method can be used to answer the first problem and the Recurrent Neural Network method can answer the second problem. Therefore, this research proposes a hybrid Convolutional Neural Network (CNN) method with a type of Recurrent Neural Network, called Long Short-term Memory (LSTM) and Gate Recurrent Unit (GRU), in order to extract the right correlation between parameters with better time variant computation. The anomaly prediction obtained using the CNN model is 81.33%, the CNN-LSTM hybrid method is 91.79%, and the CNN-GRU hybrid is 91.46%. Thus, the CNN-LSTM hybrids provide increased accuracy of gas turbine anomaly predictions with better parameter extraction and time-variant analysis capabilities."
Depok: Fakultas Teknik Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Theresia Gowandi
"Analisis sentimen adalah salah satu bidang dari Pemrosesan Bahasa Alami yang membangun sistem untuk mengenal opini dalam teks dan mengelompokkan ke dalam sentimen positif atau negatif. Banyak peneliti telah membangun model yang menghasilkan akurasi terbaik dalam melakukan analisis sentimen. Tiga diantaranya adalah Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), dan Gated Recurrent Unit (GRU), yang merupakan bagian dari deep learning. CNN digunakan karena kemampuannya dalam mengekstrak fitur penting dalam penggalan kalimat, sedangkan LSTM dan GRU digunakan karena kemampuannya yang memiliki memori akan input yang telah diproses sebelumnya. GRU memiliki struktur yang lebih sederhana dibandingkan dengan LSTM. Ketiga model tersebut dapat digabungkan menjadi model gabungan LSTM-CNN, CNN-LSTM, GRU-CNN, dan CNN-GRU. Penelitian sebelumnya telah membuktikan bahwa model gabungan tersebut memiliki akurasi yang lebih baik dibandingkan dengan model dasar LSTM, GRU, dan CNN. Implementasi model dilakukan pada data ulasan aplikasi berbahasa Indonesia. Hasilnya, didapatkan bahwa hampir seluruh model gabungan memiliki akurasi yang lebih baik dibandingkan dengan model dasar.

Sentiment analysis is one of the fields of Natural Language Processing that builds a system to recognize and extract opinion in the form of text into positive or negative sentiment. Nowadays, many researchers have developed methods that yield the best accuracy in performing analysis sentiment. Three particular models are Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU), which are part of deep learning architectures. CNN is used because of its ability to extract important features from each sentence fragment, while LSTM and GRU are used because of their ability to have a memory of prior inputs. GRU has a simpler and more practical structure compared to LSTM. These models can be combined into combined LSTM-CNN, CNN-LSTM, GRU-CNN, and CNN-GRU model. Former researches have proved that these models have better accuracy compared to standard models. This research is focused on the performance of all the combined LSTM-CNN, CNN-LSTM, GRU-CNN, CNN-GRU models and will be compared to the standard LSTM, GRU, CNN models. Implementation of the model is performed on a collection of application review data in Indonesian text. As a result, almost all of the combined models have better accuracy than the standard models."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fairuzia Zahira
"Demam Berdarah Dengue (DBD) merupakan penyakit yang disebabkan oleh virus dengue (DENV) yang ditularkan kepada manusia melalui gigitan nyamuk betina. DBD cenderung memiliki siklus musiman, dimana puncak transmisinya di saat dan setelah musim hujan. Faktor iklim yang paling berpengaruh terhadap kasus DBD adalah curah hujan, suhu, dan kelembapan. Berdasarkan data dari Kemenkes (2021), masih terjadi penurunan dan peningkatan jumlah penderita DBD pada tahun 2016-2020. Oleh karena itu, diperlukan adanya pencegahan untuk mengendalikan jumlah kasus DBD. Prediksi jumlah insiden DBD dengan menggunakan deep learning dapat menjadi alternatif dalam pengendalian kasus DBD. Penelitian ini menggunakan data insiden DBD dan data iklim yang terdiri dari data temperatur rata-rata, kelembapan rata-rata, dan curah hujan di DKI Jakarta. Data yang digunakan merupakan data yang tercatat dari tahun 2008-2023. Prediksi insiden DBD dilakukan pada 5 wilayah di DKI Jakarta, yaitu Jakarta Barat, Jakarta Pusat, Jakarta Selatan, Jakarta Timur, dan Jakarta Utara. Untuk mencapai tujuan penelitian, penelitian ini menggunakan metode Long Short-Term Memory (LSTM). LSTM merupakan merupakan arsitektur recurrent network yang mampu mengingat informasi dalam jangka waktu yang lama. Hasil analisis menunjukkan bahwa LSTM dapat diimplementasikan untuk memprediksi insiden DBD di DKI Jakarta dimana wilayah Jakarta Pusat memiliki hasil terbaik dengan nilai MAE sebesar 6,021466 dan nilai RMSE sebesar 9,062668.

Dengue Hemorrhagic fever (DHF) is a disease caused by the dengue virus (DENV), which is transmitted to humans through the bite of female mosquitoes. Dengue tends to have a seasonal cycle, with transmission peaks during and after the rainy season. The climatic factors that have the most influence on dengue cases are rainfall, temperature, and humidity. Based on data from the Ministry of Health (2021), there are still changes in the number of dengue patients in 2016-2020. Therefore, prevention is needed to control the number of dengue cases. Predicting the number of dengue incidents using deep learning can be an alternative in controlling dengue cases. This study uses dengue incidence data and climate data consisting of average temperature, average humidity, and rainfall in DKI Jakarta. Data used is data recorded from 2008 - 2023. The prediction of dengue incidence was carried out in 5 regions in DKI Jakarta, namely West Jakarta, Central Jakarta, South Jakarta, East Jakarta, and North Jakarta. To achieve the research objectives, this study uses the Long Short-Term Memory (LSTM) method. LSTM is a recurrent network architecture that is able to remember information over a long period of time. The analysis results show that LSTM can be implemented to predict dengue incidents in DKI Jakarta, where Central Jakarta region has the best results with an MAE value of 6,021466 and an RMSE value of 9,062668.
"
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Athif Zulfikar Adrain
"

Sejak tahun 2017 hingga Oktober 2023, telah terjadi peningkatan jumlah investor Indonesia sebesar 959%, yang menyoroti kebutuhan akan model peramalan untuk membantu mereka mendapatkan keuntungan dari pasar modal. Diversifikasi investasi, seperti pasar modal syariah dengan tolak ukur Jakarta Islamic index (JII) yang relatif lebih rendah risiko, telah menjadi alternatif yang penting. Penelitian ini bertujuan untuk menentukan model terbaik untuk meramalkan harga Jakarta Islamic Index (JII) dengan membandingkan metode tunggal dan hibrida yang menggabungkan transformasi Discrete Wavelet Transform (DWT), model ekonometrik ARIMA, dan model artificial intelligence LSTM, berdasarkan evaluasi Mean Absolute Percentage Error (MAPE) dan akurasi ketepatan arah pergerakan indeks saham. Selain itu, penelitian ini juga mengevaluasi strategi investasi terbaik di pasar modal syariah antara strategi market timing dan buy-and-hold. Metodologi yang digunakan adalah pendekatan prediktif-eksploratif untuk menggali informasi dari data JII dan mengolahnya dengan enam model. Temuan menunjukkan bahwa model tunggal ARIMA sendiri mencapai MAPE terendah sebesar 0.631%. Nilai MAPE untuk model-model lainnya adalah sebagai berikut: ARIMA-LSTM sebesar 0.643%, DWT-ARIMA sebesar 0.736%, DWT-ARIMA-LSTM sebesar 0,744%, LSTM sebesar 0.992%, dan DWT-LSTM sebesar 1.609%. Selain itu, akurasi ketepatan arah peramalan tertinggi dicapai oleh model DWT-ARIMA-LSTM dengan 50.48% sedangkan ARIMA hanya 45.47%, menunjukkan pentingnya mempertimbangkan tidak hanya nilai MAPE tetapi juga akurasi arah dalam evaluasi model peramalan. Dengan menggunakan model DWT-ARIMA-LSTM untuk meramalkan harga JII yang diterapkan pada strategi market timing, ditemukan bahwa pendekatan ini menghasilkan simple return sebesar 19.78%, secara signifikan mengungguli strategi buy-and-hold, yang menghasilkan pengembalian negatif sebesar -5.44%. Namun, ketika disesuaikan dengan biaya transaksi simple return yang didapatkan dengan strategi market timing menjadi -28.08%. Dengan demikian, meskipun melakukan peramalan dapat menghasilkan return yang menarik, penting untuk mempertimbangkan biaya transaksi sebagai faktor krusial dalam strategi investasi.


From 2017 to October 2023, there has been a 959% increase in the number of Indonesian investors, highlighting the need for forecasting models to help them benefit from the capital market. Investment diversification, such as the Islamic capital market with the relatively lower-risk Jakarta Islamic index (JII) benchmark, has become an important alternative. This research aims to determine the best model for forecasting the price of the Jakarta Islamic Index (JII) by comparing single and hybrid methods that combine Discrete Wavelet Transform (DWT), ARIMA econometric model, and LSTM artificial intelligence model, based on the evaluation of Mean Absolute Percentage Error (MAPE) and accuracy of stock index movement direction. In addition, this study also evaluates the best investment strategy in the Islamic capital market between market timing and buy-and-hold strategies. The methodology used is a predictive-exploratory approach to extract information from the JII data and process it with six models. The findings showed that the single ARIMA model alone achieved the lowest MAPE of 0.631%. The MAPE values for the other models are as follows: ARIMA-LSTM at 0.643%, DWT-ARIMA at 0.736%, DWT-ARIMA-LSTM at 0.744%, LSTM at 0.992%, and DWT-LSTM at 1.609%. In addition, the highest forecasting directional accuracy was achieved by the DWT-ARIMA-LSTM model with 50.48% while ARIMA was only 45.47%, indicating the importance of considering not only the MAPE value but also directional accuracy in the evaluation of forecasting models. Using the DWT-ARIMA-LSTM model to forecast JII prices applied to a market timing strategy, it is found that this approach generates a simple return of 19.78%, significantly outperforming the buy-and-hold strategy, which generates a negative return of -5.44%. However, when adjusted for transaction costs the simple return obtained with the market timing strategy becomes -28.08%. Thus, while forecasting can generate attractive returns, it is important to consider transaction costs as a crucial factor in investment strategy.

 

"
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rehan Hawari
"Jatuh merupakan penyebab utama kedua cedera dan kematian yang tidak disengaja di seluruh dunia. Kejadian ini sering terjadi pada lansia dan frekuensinya meningkat setiap tahun. Sistem pendeteksi aktivitas jatuh yang reliabel dapat mengurangi risiko cedera yang dialami. Mengingat jatuh adalah kejadian yang tidak dikehendaki atau terjadi secara tiba-tiba, sulit untuk mengumpulkan data jatuh yang sebenarnya. Deteksi jatuh juga sulit karena kemiripannya dengan beberapa aktivitas seperti jongkok, dan mengambil objek dari lantai. Selain itu, beberapa tahun belakangan dataset mengenai aktivitas jatuh yang tersedia secara publik juga terbatas. Oleh karena itu, di tahun 2019, beberapa peneliti mencoba membuat dataset jatuh yang komprehensif yang mensimulasikan kejadian yang sebenarnya dengan menggunakan perangkat kamera dan sensor. Dataset yang dihasilkan dataset multimodal bernama UP-Fall. Menggunakan dataset tersebut, penelitian ini mencoba mendeteksi aktivitas jatuh dengan pendekatan Convolutional Neural Network (CNN) dan Long Short Term Memory (LSTM). CNN digunakan untuk mendeteksi informasi spasial dari data citra, sedangakan LSTM digunakan untuk mengeksploitasi informasi temporal dari data sinyal. Kemudian, hasil dari kedua model digabungkan dengan strategi majority voting. Berdasarkan hasil evaluasi, CNN memperoleh akurasi sebesar 98,49% dan LSTM 98,88%. Kedua model berkontribusi kepada performa strategi majority voting sehingga mendapatkan akurasi (98,31%) yang melebihi akurasi baseline (96,4%). Metrik evaluasi lain juga meningkat seperti precision naik 11%, recall 14%, dan F1-score 12% jika dibandingan dengan baseline

.Fall is the second leading cause of accidental injury and death worldwide. This event often occurs in the elderly and the frequency is increasing every year. Reliable fall activity detection system can reduce the risk of injuries suffered. Since falls are unwanted events or occur suddenly, it is difficult to collect actual fall data. It is also difficult because of the similarity to some activities such as squatting, and picking up objects from the floor. In addition, in recent years the fall dataset that is publicly available is limited. Therefore, in 2019, some researchers tried to create a comprehensive fall dataset that simulates the actual events using camera and sensor devices. The experiment produced a multimodal dataset UP-Fall. Using this dataset, this study tries to detect falling activity using Convolutional Neural Network and Long Short Term Memory approaches. CNN is used to detect spatial information from image data, while LSTM is used to exploit temporal information from signal data. Then, the results of the two models are combined with the majority voting strategy. Based on the evaluation results, CNN obtained an accuracy of 98.49% and LSTM 98.88%. Both models contribute to the performance of the majority voting strategy with the result that the accuracy (98.31%) exceeds baseline accuracy (96.4%). Other evaluation metrics also improved such as precision goes up to 11%, recall 14%, and F1-score 12% in comparison with baseline."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Stanley Pratama
"Parafrasa merupakan suatu cara untuk menuliskan kalimat dengan kata-kata lain dengan maksud atau tujuan yang sama. Pendeteksian parafrasa otomatis dapat dilakukan dengan menggunakan Natural Language Sentence Matching (NLSM) yang merupakan bagian dari Natural Language Processing (NLP). NLP merupakan teknik komputasi untuk memproses teks secara umum, sedangkan NLSM dikhususkan untuk mencari hubungan antar dua kalimat. Dengan adanya perkembangan neural network (NN), maka saat ini NLP dapat lebih mudah dilakukan oleh komputer.Model untuk mendeteksi maupun membuat parafrasa Bahasa Inggris sudah banyak dikembangkan dibandingkan dengan Bahasa Indonesia yang data pelatihannya lebih sedikit. Penelitian ini mengusulkan Model SPratama yang memodelkan deteksi parafrasa untuk Bahasa Indonesia menggunakan recurrent neural network (RNN) yaitu bidirectional long short-term memory (BiLSTM) dan bidirectional gated recurrent unit (BiGRU). Data yang digunakan adalah “Quora Question Pairs” yang diambil dari Kaggle dan diterjemahkan ke Bahasa Indonesia menggunakan Google Translate. Hasil penelitian ini menunjukkan bahwa model-model yang diusulkan mendapatkan akurasi sekitar 80% untuk pendeteksian kalimat parafrasa.

Paraphrasing is a way to write sentences with other words with the same intent or purpose. Automatic paraphrase detection can be done using Natural Language Sentence Matching (NLSM) which is part of Natural Language Processing (NLP). NLP is a computational technique for processing text in general, while NLSM is used specifically to find the relationship between two sentences. With the development neural network (NN), nowadays NLP can be done more easily by computers. Many models for detecting and paraphrasing in English have been developed compared to Indonesian, which has less training data. This study proposes SPratamaModel, which models paraphrase detection for Indonesian using a recurrent neural network (RNN), namely bidirectional long short-term memory (BiLSTM) and bidirectional gated recurrent unit (BiGRU). The data used is "Quora Question Pairs" taken from Kaggle and translated into Indonesian using Google Translate. The results of this study indicate that the proposed models have the accuracy of around 80% for the detection of paraphrased sentences."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Gita Kartika Suriah
"Analisis sentimen merupakan suatu proses untuk menentukan sikap atau sentimen dari penulis mengenai hal tertentu. Proses pengelompokan sentimen secara manual membutuhkan waktu cukup lama, sehingga diusulkan untuk menggunakan machine learning. Pada penelitian ini, model machine learning yang digunakan merupakan model CNN-BiLSTM (Convolutional Neural Network - Bidirectional Long Short-Term Memory) dan BiLSTM-CNN (Bidirectional Long Short-Term Memory - Convolutional Neural Network) yang menghasilkan kinerja yang lebih baik dibandingkan model CNN dan BiLSTM pada permasalahan analisis sentimen. Supaya model dapat belajar secara berkelanjutan dari beberapa domain data, model tersebut juga diimplementasikan lifelong learning. Hasilnya, model CNN-BiLSTM menunjukkan kinerja transfer of knowledge yang lebih baik dibandingkan oleh model BiLSTM-CNN maupun model dasarnya. Di sisi lain, model BiLSTM-CNN menunjukkan kinerja yang lebih buruk dibandingkan model dasarnya. Sedangkan, hasil loss of knowledge menunjukkan bahwa kinerja model CNN- BiLSTM lebih buruk dari BiLSTM-CNN. Selain itu, kedua model gabungan tersebut menunjukkan kinerja yang lebih baik dibandingkan model CNN, tetapi lebih buruk dibandingkan model BiLSTM. Untuk pengembangan lebih lanjut, diimplementasikan pula lifelong learning dengan pembaruan vocabulary. Dengan implementasi tersebut, model mampu mempelajari vocabulary dari domain data 2, 3, 4, dan 5. Pembaruan vocabulary ternyata meningkatkan kinerja model pada transfer of knowledge dan loss of knowledge.

Sentiment analysis is a process to determine the attitude or sentiment of the author regarding certain matters. The process of classifying sentiments manually takes a long time, so it is proposed to use machine learning. In this study, the machine learning model used is the CNN-BiLSTM (Convolutional Neural Network - Bidirectional Long Short-Term Memory) and BiLSTM-CNN (Bidirectional Long Short-Term Memory - Convolutional Neural Network) models which produce better performance than the CNN and BiLSTM models on the problem of sentiment analysis. In order for the model to learn continuously from several data domains, the model is also implemented lifelong learning. As a result, the CNN-BiLSTM model shows better transfer of knowledge performance compared to the BiLSTM-CNN model and its base model. On the other hand, the BiLSTM-CNN model shows a worse performance than its base model. Meanwhile, the results of loss of knowledge show that the performance of the CNN-BiLSTM model is worse than the BiLSTM-CNN model. In addition, the two combined models show better performance than the CNN model, but worse than the BiLSTM model. For further development, lifelong learning is also implemented with an update to vocabulary. With this implementation, the model is able to learn vocabulary from data domain 2, 3, 4, and 5. In fact, the vocabulary update has an effect in increasing the performances of transfer of knowledge and loss of knowledge.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>