Hasil Pencarian

Ditemukan 25112 dokumen yang sesuai dengan query

Nasrullah

Resolusi korererensi menggunakan metode association rules

"Resolusi koreferensi merupakan salah satu tugas dalam ekstraksi informasi yang bertujuan untuk mengenali hubungan identitas antar frase-frase yang terdapat pada teks dokumen. Pasangan frase yang memiliki hubungan identitas memiliki arti bahwa pasangan frase tersebut merujuk kepada entitas yang sama. Penelitian ini bertujuan untuk melihat sejauh mana metode association rules dapat digunakan pada resolusi koreferensi. Sistem resolusi koreferensi dikembangkan dengan pendekatan machine learning. Metode machine learning yang diterapkan pada sistem adalah association rules. Association rules untuk resolusi koreferensi dalam penelitian ini dibuat berdasarkan informasi kelas kata, kelas nama, kesamaan karakter penyusun frase, serta letak atau posisinya dalam dokumen. Sistem diimplementasikan menggunakan bahasa pemrograman Java. Hasil uji coba menunjukkan bahwa metode association rules dapat digunakan untuk menyelesaikan tugas resolusi koreferensi. Uji coba dilakukan pada artikel-artikel media massa online dari Republika dan dapat diperoleh F-measure hingga 79,68%."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2005

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Budiono Wibowo, supervisor

Pengenalan entitas bernama menggunakan metode associaton rules dengan fitur berganda

"Penelitian ini mengembangkan sistem pengenalan entitas bernama pada teks dokumen berbahasa Indonesia menggunakan pendekatan machine learning. Metode dalam machine learning yang digunakan adalah association rules. Entitas yang dikenali pada penelitian ini adalah entitas nama orang, nama organisasi dan nama lokasi. Aturan-aturan untuk mengenali suatu entitas dibuat berdasarkan informasi morfologi dan kelas kata yang digunakan sebagai fitur term/token yang ingin dikenali. Suatu term dapat mempunyai satu fitur (fitur tunggal) atau banyak fitur (fitur berganda). Fitur berganda dapat dibuat berdasarkan informasi morfologi, informasi kelas kata dan gabungan keduanya. Uji coba sistem dilakukan pada beberapa kombinasi penggunaan informasi morfologi dan kelas kata dalam aturan. Hasil uji coba menunjukkan bahwa sistem dapat melakukan pengenalan entitas bernama dengan F-measure tertinggi sebesar 79.39%. Hasil ini diperoleh dengan aturan pengenalan entitas bernama yang dibuat berdasarkan gabungan informasi morfologi dan kelas kata."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2005

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

M. Fatkhul Amin

Event extraction pada teks berbahasa Indonesia melalui pendekatan machine learning: perbandingan metode association rules, decision tree, dan neural networks

"Event Extraction merupakan salah satu tugas dalam sistem ekstraksi informasi yang bertujuan untuk menemukan kumpulan informasi event dari suatu dokumen. Informasi tersebut dapat berupa informasi pihak-pihak yang terlibat, tempat kejadian, waktu, dan segala informasi yang terkait dengan event. Penelitian ini bertujuan untuk melakukan proses ekstraksi event (event pertemuan) pada teks berbahasa Indonesia. Dari event pertemuan tersebut, informasi yang dicari adalah informasi pihak yang terlibat (person), tempat (location), serta waktu (time) terjadinya event. Ekstraksi dilakukan dengan menggunakan pendekatan machine learning. Sedangkan metode machine learning yang digunakan adalah association rules, decision tree, dan neural networks. Penelitian bertujuan untuk melihat perbandingan kinerja ketiga metode tersebut terhadap ekstraksi event. Uji coba dilakukan pada artikel-artikel media massa online dari Kompas, Jawa Pos, Republika, dan Sinar Harapan. Pada ekstraksi event, diketahui bahwa metode decision tree menunjukkan kinerja yang lebih baik dibandingkan metode association rules dan metode neural networks dengan F-measure mencapai 83,95%. Metode association rules menunjukkan kinerja yang lebih baik dibandingkan dengan metode neural networks dengan F-measure masing-masing sebesar 82,41% dan 81,57%."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Amanda Nydia Augustizhafira

Akurasi transfer learning menggunakan metode neural network untuk masalah analisis sentimen pada tweets berbahasa Indonesia = The accuracy of transfer learning using neural network method for sentiment analysis problem on Indonesian tweets

"Analisis sentimen merupakan bagian dari data mining text mining , yaitu proses memahami, mengekstrak, dan mengolah data tekstual secara otomatis untuk mendapatkan informasi. Pada penelitian ini, analisis sentimen diterapkan pada salah satu media sosial, yaitu Twitter. Analisis sentimen tergolong sebagai masalah klasifikasi yang dapat diselesaikan menggunakan salah satu metode machine learning, yaitu Neural Network. Pada machine learning, data dibagi menjadi data pelatihan dan data pengujian yang berasal dari domain yang sama.

Permasalahan utama pada penelitian ini adalah data pelatihan dan data pengujian berasal dari dua domain yang berbeda, sehingga perlu diterapkan pembelajaran lain selain machine learning. Masalah tersebut dapat diselesaikan dengan menggunakan transfer learning. Transfer learning merupakan suatu pembelajaran model yang dibangun oleh suatu data pelatihan dari suatu domain dan diuji oleh suatu data pengujian dari domain yang berbeda dari domain data pelatihan. Simulasi dalam penelitian ini menghasilkan suatu akurasi transfer learning dengan metode Neural Network yang nantinya akan diuji dengan fitur n-gram bi-gram dan tri-gram serta satu metode seleksi fitur, yaitu Extra-Trees Classifier.

Dalam penelitian ini, nilai akurasi transfer learning tertinggi didapat saat hidden layer berjumlah satu. Sebagian besar nilai akurasi tertinggi didapat saat penggunaan 250 neuron pada hidden layer. Fungsi aktivasi ReLU dan tanh menghasilkan nilai akurasi yang lebih tinggi dibandingkan fungsi aktivasi logistic sigmoid. Penggunakan metode seleksi fitur dapat meningkatkan kinerja transfer learning sehingga nilai akurasinya lebih tinggi dibandingkan simulasi tanpa penggunaan metode seleksi fitur.

Sentiment analysis is a part of data mining text mining , which is the process of understanding, extracting, and processing textual data automatically to obtain information. In this research, sentiment analysis is applied to one social media called Twitter. Sentiment analysis is categorized as a classification problem that can be solved using one of machine learning methods, namely Neural Network. In machine learning, data is divided into training data and test data from the same domain.
The main problem in this research is training data and test data come from two different domains, so it is necessary to apply other learning beside machine learning. The problem can be solved by using transfer learning. Transfer learning is a model learning constructed by a training data from a domain and tested by a test data from a different domain from the training data domain. The simulation in this research resulted in an accuracy of learning transfer with Neural Network method which will be tested using n grams bi grams and tri grams and one feature selection method called Extra Trees Classifier.
In this research, the highest value of transfer learning accuracy is obtained when one hidden layer is used. Most of the highest accuracy values are obtained from the use of 250 neurons on the hidden layer. The activation function of ReLU and tanh yield a higher accuracy value than the logical activation function sigmoid . The use of feature selection method can improve the transfer learning performance so that the accuracy value is higher than simulation without the use of feature selection method."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Michellain Millenia Setyowardhani

Identifikasi Fasies Menggunakan Metode Pembelajaran Mesin pada Formasi Pucangan, Daerah Kabupaten Sidoarjo, Jawa Timur = Facies Identification Using Machine Learning Methods in the Pucangan Formation, Sidoarjo Regency, East Java

"Saat ini geosaintis memasuki era big data dan pembelajaran mesin memberikan potensi besar untuk berkontribusi dalam masalah geosains (Karpatne dkk., 2017). Automasi dalam analisis fasies perlu dilakukan untuk meningkatkan keakuratan, juga mengurangi waktu dan biaya dalam kegiatan pengembangan sumur sehingga dapat meningkatkan hasil produksi. Penelitian dilakukan menggunakan data log sumur pengeboran, laporan deskripsi batuan inti, dan deskripsi petrografi di reservoir gas Lapangan X. Akumulasi gas berada di reservoir utama hasil endapan vulkaniklastik pada Formasi Pucangan. Proses pengelompokan dilakukan menggunakan algoritma K-Means dan di analisis menggunakan Cutoff Crossplot. Kemudian dilanjutkan dengan klasifikasi yang dilakukan menggunakan pembelajaran tersupervisi dengan jenis algoritmaSupport Vector Machine (SVM), Random Forest, dan Extreme Gradient Boosting (XGBoost). Lokasi penelitian berada di wilayah kerja Minarak Brantas Gas Inc (MBGI) Kabupaten Sidoarjo, Jawa Timur. Lapangan X terletak pada reservoir vulkaniklastikberumur Pleistosen dan terletak di onshore Cekungan Jawa Timur. Interval produksi berada di bagian bawah yang terendapkan di lingkungan neritik luar atau lingkungan turbiditik. Lapangan X terdiri dari empat fasies yaitu, batulempung, batulanau, batupasirvulkanik, dan batupasir karbonatan. Algoritma pembelajaran mesin yang paling baik digunakan untuk identifikasi fasies pada Lapangan X adalah RandomForest dengan hasil akurasi f1-score tertinggi, dan nilai RMSE (Root Mean Square Error) paling rendah dibandingkan kedua algoritma lain.

Geoscientists are currently entering the era of big data and machine learning provides great potential to contribute to geoscience problems (Karpatne et al., 2017). Automation in facies analysis needs to be done to increase accuracy, also reduce time and costs in well development activities so as to increase production yields. The research was conducted using drilling well log data, core rock description reports, and petrographic descriptions of gas reservoirs in Field X. Gas accumulation is in the main reservoir as a result of volcaniclastic deposits in the Pucangan Formation. The clustering process was carried out using the K-Means algorithm and analyzed using the Cutoff Crossplot. Then proceed with the classification which is carried out using supervised learning with the types of Support Vector Machine (SVM), Random Forest, and Extreme Gradient Boosting (XGBoost) algorithms. The research location is in the working area of Minarak Brantas Gas Inc. (MBGI) Sidoarjo Regency, East Java. Field X is in a Pleistocene volcaniclastic reservoir and is locatedonshore in the East Java Basin. The production interval is at the bottom which is deposited in an outer neriticenvironment or a turbiditic environment. Field X consists of four facies, namely, claystone, siltstone, volcanic sandstone, and carbonate sandstone. The bestmachine learning algorithm used for faciesidentification in Field X is Random Forest with thehighest f1-score accuracy, and the lowest RMSE (RootMean Square Error) value compared to the other two algorithms."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Yovan Yudhistira Widyananto

Integrasi Machine Learning dan Analisisnya untuk menghasilkan Snort Rule pada Proyek Mata Elang = Analysis and Integration of Machine Learning to Produce Snort Rules in Mata Elang Project

"Keamanan privasi data dan informasi dalam internet sering menjadi topik pembahasan dari waktu ke waktu, hal ini dikarenakan metode penyerangan siber selalu berevolusi menyesuaikan dengan struktur keamanan yang ada, menjadikan bidang keamanan siber menjadi bagaikan kompetisi untuk selalu lebih dahulu dari lawannya. Salah satu contoh implementasi keamanan siber merupakan Intrusion Detection System, dikenal juga dengan IDS. IDS dapat membantu menjaga sebuah jaringan dengan mendeteksi jika ada tanda-tanda penyerangan, namun dengan ini saja tidak cukup untuk memaksimalkan keamanan sebuah jaringan. Dari dasar IDS ini, sebuah proyek mencoba mengembangkan konsepnya dan membuat struktur besar, dan berhasil diciptakan proyek Mata Elang. Struktur Mata Elang dapat menjadi perantara antara internet dengan jaringan yang dilindunginya, dan ketika terjadi serangan, aktivitas tersebut akan dideteksi, ditahan, dan diproses oleh Mata Elang. Sistem deteksi Mata Elang bergantung kepada framework Snort. Sayangnya, Snort tidak memiliki kemampuan untuk beradaptasi di luar dari konfigurasi yang telah diberikan kepadanya. Dalam penelitian ini, penulis akan mengimplementasikan Machine Learning untuk meningkatkan keamanan yang diberikan pada proyek Mata Elang, spesifiknya pada sensornya yang menggunakan Snort. Setelah segala proses perancangan, pembuatan, dan pengujian telah dilakukan, hasil akhir yang didapatkan dari sistem Machine Learning merupakan sistem prediksi yang memuaskan untuk memprediksi kategori serangan bahkan dengan dukungan data yang lemah, namun kemampuan dari aturan Snort yang dihasilkan masih belum diuji dengan matang.

The talk about the security of private data and information will continue to be a relevant topic because of the nature of the concept. Cyberattacks have always been adapting according to the technology and structure that exists at the time, and so cybersecurity will continue to be a competition for gaining the advantage against their contrarian. One of the prime examples in cybersecurity implementation is Intrustion Detection Systems, also known as the shortened term, IDS. IDS can help guard a network by detecting different kinds of anomalies or attacks, although this alone wouldn’t be enough to maximize the level of proper security necessary for a whole network. Under the basic concept of IDS, a project attempts to develop an IDS and create a larger structure. The project was successfully implemented and now titled as Mata Elang. Mata Elang’s structure is an intermediary between an internet connection and the network it is connected to, and when an attack happens, those activities will be detected, interrupted, and then processed by Mata Elang. Mata Elang’s detection system completely relies on the framework Snort. Unfortunately, Snort does not have the capabilities to adapt outside the configurations that has been given to it. In this research, the writer will implement Machine Learning to further increase the security provided by Mata Elang, specifically on the sensors that uses Snort. After every step of the planning, making, and testing has been done the final result of the product was a Machine Learning system that has a satisfactory performance in categorizing the attacks, even with a weak supporting data, however the performance of the snort rules generated by it has not been tested thoroughly."

Depok: Fakultas Teknik Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Hepatika Zidny Ilmadina

Klasifikasi Leptomeningeal Metastasis pada Pasien Leukemia Menggunakan Metode Convolutional Neural Network via Transfer Learning = Leptomeningeal Metastasis Classification in Leukemia Patients Using the Convolutional Neural Network via Transfer Learning

"Leptomeningeal metastatis merupakan indikasi keganasan yang terjadi pada pasien leukemia. Meskipun hanya memiliki porsi 30-40% yang menyebabkan kekambuhan keganasan pada pasien leukemia, hal tersebut yang dijadikan dasar dalam menentukan pengobatan terbaik yang diberikan kepada mereka. Leptomeningeal metastasis lebih baik dideteksi dengan menggunakan Magnetic Resonance Imaging (MRI) karena sensitivitasnya yang tinggi dalam citra neuraxis. Kemampuan expert yang tinggi untuk melihat dan menganalisis sangat diperlukan dalam membaca hasil Brain MRI pasien leukemia dengan suspek leptomeningeal metastasis. Oleh karena itu, klasifikasi akan memakan waktu yang lama dan memungkinkan kesalahan pembacaan hasil. Berbagai metode telah banyak diusulkan dan dikembangkan dalam klasifikasi Brain MRI untuk mendapatkan hasil terbaik namun tantangan dalam penelitian ini adalah leptomeningeal metastasis yang karakteristiknya lebih sudah dikenali dibandingkan tumor pada otak. Oleh karena itu peneliti mengusulkan pengklasifikasian leptomeningeal metastasis dengan menggunakan metode CNN via transfer learning. Dengan berbagai skenario yang dilakukan, hasil akurasi terbaik adalah implementasi metode CNN (ResNet50) via transfer learning mencapai 82,22%.

Leptomeningeal metastasis is an indication of malignancy that occurs in leukemia patients. Although it only has a 30-40% portion, which causes recurrence of malignancy in leukemia patients, it is the basis for determining the best treatment given to them. Leptomeningeal metastases are better detected by using Magnetic Resonance Imaging (MRI) because of their high sensitivity in neuroaxis images. A high expert ability to see and analyze is needed in reading the brain MRI results of leukemia patients with suspected leptomeningeal metastasis. Therefore, the classification will take a long time and may an incorrect reading of the results. Various methods have been proposed and developed in the brain MRI classification to get the best results, but the challenge in this research is leptomeningeal metastasis, whose characteristics are more not recognizable than tumors in the brain. Therefore, we propose the classification of leptomeningeal metastasis using the CNN method via transfer learning. With various scenarios done, we obtained the best accuracy result is the implementation of the CNN (ResNet50) method via transfer learning, up to 82.22%."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Prajna Wira Basnur

Pengklasifikasian artikel berita berbahasa Indonesia secara otomatis menggunakan ontologi

"Klasifikasi dokumen adalah sebuah metode untuk menentukan suatu dokumen termasuk ke suatu kategori secara otomatis berdasarkan isi dokumen. Metode Naïve Bayes dan ontologi merupakan metode klasifikasi dokumen teks yang digunakan dalam penelitian ini. Data yang digunakan dalam penelitian ini berupa artikel berita berbahasa Indonesia dari situs http://www.kompas.com. Dalam penelitian ini menggunakan lima kategori dalam domain olahraga untuk melakukan klasifikasi dokumen, yaitu kategori bulutangkis, basket, otomotif, sepakbola, dan tenis. Klasifikasi dokumen dengan menggunakan ontologi dilakukan dengan membandingkan nilai kemiripan diantara dokumen dan sebuah node yang ada di ontologi. Sebuah dokumen diklasifikasikan ke sebuah kategori atau node, jika memiliki nilai kemiripan paling tinggi diantara semua node yang ada di ontologi. Hasil penelitian menunjukkan bahwa ontologi dapat digunakan untuk melakukan klasifikasi dokumen. Nilai recall, precision, dan f-measure untuk klasifikasi dokumen menggunakan ontologi berturut-turut adalah 97.03%, 91.63%, dan 94.02%.

Document classification is a method for determine document category automatically based on contents of document. In this research, we use Naïve Bayes and Ontology method for document classification. Mass media in Bahasa Indonesia is used as data in this research. Data is taken from http//www.kompas.com. We uses five category in sports domain for document classification that comprise with bulutangkis, basketball, automotive, soccer, and tennis category. Document classification uses ontology can be done with compare similarity value between document and a node in ontology. A document can classified to a category or node, if a document has highest similarity value between all node in ontology. In this research indicate that ontology can used for document classification. Recall, precision, and f-measure value for document classification using ontology in a row are 97.03%, 91.63%, and 94.02%."

2009

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

Alvin Subakti

Analisis kinerja BERT sebagai metode representasi teks untuk Text Clustering = Performance analysis of BERT as a text representation method for Text Clustering

"Text clustering adalah teknik pengelompokan teks sehingga teks di dalam kelompok yang sama memiliki tingkat similaritas yang lebih tinggi satu sama lain dibandingkan dengan teks pada kelompok yang berbeda. Proses pengelompokkan teks secara manual membutuhkan waktu dan sumber daya yang banyak sehingga digunakan machine learning untuk melakukan pengelompokan secara otomatis. Representasi dari teks perlu diekstraksi sebelum dimasukkan ke dalam model machine learning. Metode yang umumnya digunakan untuk mengekstraksi representasi data teks adalah TFIDF. Namun, metode TFIDF memiliki kekurangan yaitu tidak memperhatikan posisi dan konteks penggunaan kata. Model BERT adalah model yang dapat menghasilkan representasi kata yang bergantung pada posisi dan konteks penggunaan suatu kata dalam kalimat. Penelitian ini menganalisis kinerja model BERT sebagai metode representasi data teks dengan membandingkan model BERT dengan TFIDF. Selain itu, penelitian ini juga mengimplementasikan dan membandingkan kinerja metode ekstraksi dan normalisasi fitur yang berbeda pada representasi teks yang dihasilkan model BERT. Metode ekstraksi fitur yang digunakan adalah max dan mean pooling. Sementara itu, metode normalisasi fitur yang digunakan adalah identity, layer, standard, dan min-max normalization. Representasi teks yang diperoleh dimasukkan ke dalam 4 algoritma clustering berbeda, yaitu k-means clustering, eigenspace-based fuzzy c-means, deep embedded clustering, dan improved deep embedded clustering. Kinerja representasi teks dievaluasi dengan menggunakan metrik clustering accuracy, normalized mutual information, dan adjusted rand index. Hasil simulasi menunjukkan representasi data teks yang dihasilkan model BERT mampu mengungguli representasi yang dihasilkan TFIDF pada 28 dari 36 metrik. Selain itu, implementasi ekstraksi dan normalisasi fitur yang berbeda pada model BERT memberikan kinerja yang berbeda-beda dan perlu disesuaikan dengan algoritma yang digunakan.

Text clustering is a task of grouping a set of texts in a way such that text in the same group will be more similar toward each other than to those from different group. The process of grouping text manually requires significant amount of time and labor. Therefore, automation utilizing machine learning is necessary. Text representation needs to be extracted to become the input for machine learning models. The common method used to represent textual data is TFIDF. However, TFIDF cannot consider the position and context of a word in a sentence. BERT model has the capability to produce text representation that incorporate position and context of a word in a sentence. This research analyzed the performance of BERT model as a text representation method by comparing it with TFIDF. Moreover, various feature extraction and normalization methods are also applied in text representation from BERT model. Feature extraction methods used are max and mean pooling. On the other hand, feature normalization methods used are identity, layer, standard, and min-max normalization. Text representation obtained become an input for 4 clustering algorithms, k-means clustering, eigenspace-based fuzzy c-means, deep embedded clustering, and improved deep embedded clustering. Performance of text representations in text clustering are evaluated utilizing clustering accuracy, normalized mutual information, and adjusted rand index. Simulation results showed that text representation obtained from BERT model outperforms representation from TFIDF in 28 out of 36 metrics. Furthermore, different feature extraction and normalization produced varied performances. The usage of these feature extraction and normalization must be altered depending on the text clustering algorithm used."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Nofa Aulia

Deteksi ujaran kebencian teks panjang berbahasa Indonesia menggunakan data facebook = Hate speech detection on Indonesian long text using facebook data

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019

T51811

UI - Tesis Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian