Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query
cover
Diyah Septi Andryani
Abstrak :
Clustering bertujuan untuk mengklasifikasikan pola yang berbeda ke dalam kelompok yang disebut cluster. Analisis gen dengan menggunakan metode clustering dinilai lebih akurat dibandingkan analisis nukleotida menggunakan penyejajaran DNA. Hybrid clustering pada tesis ini mengkombinasikan algoritma fuzzy c-means dan algoritma divisive mampu meningkatkan keakurasian jika dibandingkan pendekatan pengelompokan partitional tradisional. Algoritma divisive akan dijalankan pada step kedua setelah hasil clustering yang diperoleh dari pengelompokan partisi fuzzy c-means. Penentuan jumlah cluster terbaik ditentukan dari nilai Indeks Davies Bauldin yang paling minimum. Sebanyak 1252 barisan DNA HPV Human papillomavirus diperoleh dari Genbank NCBI dengan proses melakukan ekstraksi ciri DNA, selanjutnya dilakukan normalisasi. Proses ekstraksi ciri, normalisasi, dan penerapan algoritma partisi fuzzy c-means dan divisive dalam metode hybrid clustering menggunakan bantuan program open source. Pada hasil hybrid clustering level awal diperoleh jumlah cluster optimum sebanyak 3 cluster dengan nilai Indeks Davies Bouldin paling minimum adalah 0.9715919. Pada level ke-2 clustering didapatkan cluster ke-1 terbagi atas 9 sub cluster dengan nilai IDB minimum adalah 0.8909797. Cluster ke-2 terbagi atas 2 sub cluster dengan nilai IDB minimum adalah 0.7650508. Cluster 3 terbagi atas 2 sub cluster dengan nilai IDB minimum adalah 0.9112528. Nilai IDB pada level kedua selalu lebih kecil dibanding nilai IDB pada level 1. Hal ini mengindikasikan bahwa hybrid clustering memberikan hasil yang lebih baik terhadap hasil clustering. ...... Clustering aims to classify the different patterns into groups called clusters. Analysis gene by using clustering method is considered more accurate than analysis of nucleotide using DNA alignment. In this thesis, hybrid clustering algorithm which combines fuzzy c means and algorithm divisive will be improve accuracy when compared to partitional clustering. Divisive algorithms will applied on second level after clustering partition using fuzzy c means. To find the best number of clusters is determined using the minimum value of Davies Bouldin Index DBI of the cluster results. The data is 1252 sequences of HPV DNA sequences obtained from Gen Bank Database in the National Centre for Biotechnology Information NCBI at http www.ncbi.nlm.nih.gov in FASTA format. The data is converted into numerical form through feature extraction using n mers frequency. The results on first level hybrid clustering obtained the optimum cluster divided into three clusters with the value of the minimum Davies Bouldin Index is 0.9715919. Morever, DBI values after implementing the second step of clustering are always producing smaller IDB values compare to the results of using first step clustering only. This condition indicates that the hybrid approach in this study produce better performance of the cluster results, in term its DBI values.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47171
UI - Tesis Membership  Universitas Indonesia Library
cover
Ghea Suryawati
Abstrak :
Salah satu cara untuk mengetahui fungsi dari ekpresi gen (DNA/Protein) adalah dengan analisis kelompok (Clustering). Metode pengelompokan HOPACH mengkombinasikan agglomerative dan partisi. Partisi yang dapat digunakan antara lain PAM, SOM, dan K-Means yang termasuk dalam hard clustering. Dalam beberapa kasus karena beberapa hal pengelompokkan objek dengan hard clustering menjadi kurang tepat. Karena itu kemudian muncul teori himpunan fuzzy (kabur, tidak pasti) yang mendasari berkembangnya metode fuzzy clustering. Salah satu metode fuzzy clustering adalah metode Fuzzy c-means (FCM) yang merupakan perkembangan dari k-means. Hasil dari penerapan algoritma partisi fuzzy c-means dalam metode pengelompokan HOPACH adalah algortima pengelompokan dengan langkah-langkah: ekstraksi ciri dengan n-mers frecuency, normalisasi, partisi dengan FCM, menentukan kelompok terbaik dengan mencari nilai MSS minimum, ordering, dan collapsing. Hal ini dilakukan berulang kali sampai kriteria berhenti terpenuhi. Penerapan algoritma ini dilakukan dengan program R. Pada penerapan algoritma partisi dalam metode HOPACH clustering, langkah normalisasi tidak perlu dilakukan, karena FCM sendiri sudah mengatasi masalah adanya outliers. Kekurangan dari penerapan ini adalah running time program yang cukup lama untuk nilai batas toleransi yang kecil.
One of the way to know the function of gene expression by clustering analysis. HOPACH clustering is combine thea agglomerative and partition method. The partition are PAM, SOM, and K-means which is part of hard clustering. In some cases because of the placement object in to a cluster with hard clustering can cause an error. So that is the reason why fuzzy set theory occurs and became the foundation of fuzzy clustering. One of the fuzzy clustering methods is Fuzzy C-means (FCM) which is developed from K-means. The result from the implementation of FCM partitioning algorithm in HOPACH clustering method is the clustering algorithm which the steps are: characteristic extraction, normalization, partition using FCM, choosing the best cluster with the minimum MSS, ordering and collapsing. The process need done by iteration until the stopping criteria has reached. The implementation of this algorithm is use R program. In the implementation of FCM partitioning algorithm in HOPACH clustering method, normalization process can be deleted, because the FCM already sole the outliers problem. This disadvantage of this implementation is the running time program need quite along time for the small tolerance limits.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
T44901
UI - Tesis Membership  Universitas Indonesia Library
cover
Triyana Muliawati
Abstrak :
ABSTRAK
Seiring perkembangan teknologi informasi dan komunikasi, pemenuhan kebutuhan informasi dapat diperoleh melalui media sosial, seperti Twitter. Banyaknya pengguna internet telah memicu aliran data yang sangat besar dan cepat, sehingga membuat analisis secara manual sulit atau bahkan tidak mungkin dilakukan. Metode otomatis diperlukan untuk menganalisis data tersebut yang salah satunya yaitu dengan topic detection and tracking (TDT). Suatu metode alternatif laindari TDT untuk masalah pendeteksian topik selain latent dirichlet allocation (LDA) adalah fuzzy clustering dengan menggunakan algoritma fuzzy Cmeans (FCM). FCM pada pendeteksian topik dapat memenuhi asumsi bahwa suatu dokumen pada Twitter dapat terdiri dari beberapa topik. FCM bekerja cukup baik di dimensi data yang rendah, akan tetapi gagal dalam dimensi data yang tinggi. Oleh karena itu, dibutuhkan suatu metode untuk mereduksi dimensi ruang eigen yang tinggi ke dimensi yang lebih rendah. Salah satu metodenya adalah singular value decomposition (SVD) dengan menggunakan truncated SVD. Pada penelitian ini, dilakukan prosestruncated SVD kemudian FCM yang dinamakanfuzzy C-means pada ruang eigen (Eigen FCM). Hasil akurasi dari metode ini menunjukkan peningkatan lebih baik dibandingkan FCM dan LDA pada pendeteksian topik.
ABSTRACT
As the information and communication technology developed, the fulfillment of information can be obtained through social media, like Twitter. The enormous number of internet users has triggeredfast and large data flow, thus making the analysis manually is difficult, or even impossible. The automated methods for data analysis is needed now, one of which is the topic detection and tracking (TDT). An alternative method other than TDT fortopic detection problemother than latent dirichlet allocation (LDA) is a fuzzy clustering algorithms using fuzzy C-means (FCM). FCM in topic detection meet the assumption that a document on Twitter can consists of several topics. FCM works pretty well in low-dimensional data, but fail in high-dimensional data. Therefore, we need a method to reduce the dimension of the high-dimensional eigenspaceinto lower dimension. One method to do that is the singular value decomposition (SVD) using truncated SVD. This papercarried out the truncated SVD process then FCM called fuzzy C-means on the eigenspace (Eigen FCM). The results of the accuracy of this method shows an increase is better than FCM and LDA on topic detection.
2016
T45625
UI - Tesis Membership  Universitas Indonesia Library
cover
Christhoper Nugraha
Abstrak :
ABSTRAK
Deteksi topik adalah proses menganalisis kumpulan data tekstual untuk menentukan topik pengumpulan data tekstual. Salah satu metode pengelompokan yang dapat digunakan untuk deteksi topik adalah metode Fuzzy C-Means (FCM). Namun, penggunaan FCM sederhana untuk pendeteksian topik tentang big data kurang efektif, karena akan memakan waktu lama dan banyak memori. FCM sederhana juga memiliki masalah lain, ketika melakukan deteksi topik aktif data dimensi tinggi, FCM sederhana hanya akan menghasilkan satu topik. Dalam penelitian ini, suatu gabungan metode Single-Pass Fuzzy C-Means (SPFCM) dan Fuzzy C-Means Berbasis Eigenspace (EFCM) diusulkan, yaitu Single-Pass Eigenspace-Based Fuzzy C-Means (SPEFCM) metode untuk mengatasi masalah ini. Data yang digunakan untuk deteksi topik adalah tweet yang berasal dari aplikasi Twitter. Lalu, keakuratan topik didapat menggunakan SPEFCM dan EFCM akan dibandingkan berdasarkan nilai koherensi. Itu hasil simulasi menunjukkan bahwa nilai koherensi topik yang diperoleh menggunakan SPEFCM adalah sebanding dengan EFCM. Ini menunjukkan bahwa SPEFCM adalah metode yang tepat untuk mendeteksi topik pada data besar, tanpa mengurangi kualitas topik yang dihasilkan.
ABSTRACT
Topic detection is the process of analyzing a textual data set to determine the topic of textual data collection. One of the grouping methods that can be used for topic detection is the Fuzzy C-Means (FCM) method. However, the use of simple FCM for the detection of topics about big data is less effective, because it will take a long time and a lot of memory. Simple FCM also has another problem, when detecting active topics of high dimensional data, simple FCM will only produce one topic. In this study, a combination of the Single-Pass Fuzzy C-Means (SPFCM) method and the Fuzzy C-Means Based on Eigenspace (EFCM) is proposed, namely the Single-Pass Eigenspace-Based Fuzzy C-Means (SPEFCM) method to overcome this problem. The data used for topic detection is tweets that come from the Twitter application. Then, the accuracy of the topics obtained using SPEFCM and EFCM will be compared based on coherence values. The simulation results show that the topic coherence value obtained using SPEFCM is comparable to EFCM. This shows that SPEFCM is the right method for detecting topics in big data, without reducing the quality of the topics produced.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Robertus Agung Pradana
Abstrak :
Pendeteksian topik adalah suatu proses yang digunakan untuk menganalisis kata-kata pada suatu koleksi data tekstual untuk menentukan topik-topik yang ada pada koleksi tersebut, bagaimana hubungan topik-topik tersebut satu sama lainnya, dan bagaimana mereka berubah dari waktu ke waktu. Metod (FCM) merupakan metode yang sering digunakan pada masalah pendeteksian topik. FCM dapat mengelompokkan dataset ke beberapa kelompok dengan baik pada dataset dengan dimensi yang rendah, namun gagal pada dataset yang berdimensi tinggi. Untuk mengatasi permasalahan tersebut, dilakukan reduksi dimensi pada dataset sebelum dilakukan pendeteksian topik. Pada penelitian ini digunakan Convolutional Autoencoder dalam reduksi dimensi pada dataset. Oleh sebab itu, metode yang digunakan pada penelitian ini dalam pendeteksian topik adalah metode Convolutional-based Fuzzy C-Means (CFCM). Data yang digunakan dalam penelitian ini data coherence pada topik antara metode CFCM dengan satu convolutional layer (CFCM-1CL) dan metode CFCM dengan tiga convolutional layer (CFCM-3CL). Hasil penelitian ini menunjukkan bahwa nilai coherence dari metode CFCM-1CL lebih tinggi dibandingkan metode CFCM-3CL.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library