Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 3 dokumen yang sesuai dengan query
cover
Septian Wulandari
"Sejak adanya penemuan tentang struktur DNA yang berupa double helix, terdapat perkembangan tentang interaksi kompleks yang dibutuhkan untuk clustering (mengelompokkan) DNA menjadi clusters (kelompok-kelompok) yang memiliki kesamaan sifat ataupun fungsinya. Clustering DNA dapat dilakukan dengan metode partisi maupun metode hirarki. Dua metode tersebut dapat dipadukan dengan melakukan tahap partisi dan hirarki secara bergantian yang dikenal dengan nama HOPACH clustering. Tahap partisi dapat dilakukan dengan algoritma SOM, PAM, dan K-Means. Algoritma SOM dipilih karena menggunakan metode unsupervised learning dan efisien untuk digunakan pada data yang besar. Proses partisi dilanjutkan dengan proses ordering kemudian dilakukan collapsing dengan proses agglomerative, sehingga hasil clustering yang diperoleh menjadi lebih akurat.
Penentuan cluster utama dilakukan dengan menghitung nilai kehomogenan hasil clustering menggunakan MSS (Mean Split Silhoutte). Kriteria penentuan cluster utama adalah pilih nilai MSS yang terkecil. Barisan 136 DNA EVD (Ebola Virus Disease) diperoleh dari Genbank NCBI dengan proses melakukan ekstraksi ciri DNA, selanjutnya melakukan normalisasi, dan dilanjutkan dengan menghitung jarak genetik menggunakan Jarak Euclidean. Matriks jarak genetik dapat dijadikan dasar untuk melakukan partisi serta clustering dengan menggunakan algoritma partisi SOM dalam metode HOPACH clustering. Proses ekstraksi ciri, normalisasi, dan penerapan algoritma partisi SOM dalam metode HOPACH clustering menggunakan bantuan program open source . Pada hasil clustering penerapan algoritma partisi SOM dalam metode HOPACH clustering diperoleh 9 cluster dengan nilai MSS sebesar 0,50280. Cluster yang dihasilkan dapat diidentifikasikan berdasarkan spesies dan tahun pertama kali mewabah.
......
Since the discovery of DNA structure in form of double helix, there is a development about the complex interaction required, DNA clustering into clusters which have the same features or functions. DNA clustering can be done by applying partitional or hierarchical method. Those two methods can be combined by doing partitional and hierarchical stage alternately known as HOPACH clustering. The partitional stage can be done by using SOM Algorithm, PAM, and K-Means. SOM algorithm is chosen because it uses unsupervised learning method and efficient to be used for large data. The partitional process is continued by ordering process and then performed collapsing with agglomerative process, so that the clustering result which is obtained will be more accurate. The determination of the main cluster done by calculating homogeneous value of the clustering result uses MSS (Mean Split Silhouette).
The determination criteria of the main cluster is choosing the smallest MSS value. 136 sequences of DNA EVD (Ebola Virus Disease) are obtained from NCBI Genbank by applying extraction of DNA sequence, after that doing normalization, and then calculating the genetic distance use Euclidean Distance. Genetic distance matrix can be used as a basis to do partitional and clustering by implementation SOM partitioning algorithm in HOPACH clustering method. The extraction of DNA sequence, normalization, and the implementation of SOM partitioning algorithm in HOPACH clustering method use open source program . On the result of implementation SOM partitioning algorithm in HOPACH clustering method retrieved 9 clusters with MSS value of 0,50280. The cluster which is obtained can be identified according to species and the first year of becoming an epidemic."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
T44913
UI - Tesis Membership  Universitas Indonesia Library
cover
Ghea Suryawati
"Salah satu cara untuk mengetahui fungsi dari ekpresi gen (DNA/Protein) adalah dengan analisis kelompok (Clustering). Metode pengelompokan HOPACH mengkombinasikan agglomerative dan partisi. Partisi yang dapat digunakan antara lain PAM, SOM, dan K-Means yang termasuk dalam hard clustering. Dalam beberapa kasus karena beberapa hal pengelompokkan objek dengan hard clustering menjadi kurang tepat. Karena itu kemudian muncul teori himpunan fuzzy (kabur, tidak pasti) yang mendasari berkembangnya metode fuzzy clustering. Salah satu metode fuzzy clustering adalah metode Fuzzy c-means (FCM) yang merupakan perkembangan dari k-means.
Hasil dari penerapan algoritma partisi fuzzy c-means dalam metode pengelompokan HOPACH adalah algortima pengelompokan dengan langkah-langkah: ekstraksi ciri dengan n-mers frecuency, normalisasi, partisi dengan FCM, menentukan kelompok terbaik dengan mencari nilai MSS minimum, ordering, dan collapsing. Hal ini dilakukan berulang kali sampai kriteria berhenti terpenuhi. Penerapan algoritma ini dilakukan dengan program R. Pada penerapan algoritma partisi dalam metode HOPACH clustering, langkah normalisasi tidak perlu dilakukan, karena FCM sendiri sudah mengatasi masalah adanya outliers. Kekurangan dari penerapan ini adalah running time program yang cukup lama untuk nilai batas toleransi yang kecil.

One of the way to know the function of gene expression by clustering analysis. HOPACH clustering is combine thea agglomerative and partition method. The partition are PAM, SOM, and K-means which is part of hard clustering. In some cases because of the placement object in to a cluster with hard clustering can cause an error. So that is the reason why fuzzy set theory occurs and became the foundation of fuzzy clustering. One of the fuzzy clustering methods is Fuzzy C-means (FCM) which is developed from K-means.
The result from the implementation of FCM partitioning algorithm in HOPACH clustering method is the clustering algorithm which the steps are: characteristic extraction, normalization, partition using FCM, choosing the best cluster with the minimum MSS, ordering and collapsing. The process need done by iteration until the stopping criteria has reached. The implementation of this algorithm is use R program. In the implementation of FCM partitioning algorithm in HOPACH clustering method, normalization process can be deleted, because the FCM already sole the outliers problem. This disadvantage of this implementation is the running time program need quite along time for the small tolerance limits.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
T44901
UI - Tesis Membership  Universitas Indonesia Library
cover
Khaola Rachma Adzima
"Penerapan algoritma partisi k-means dalam metode HOPACH clustering dalam penelitian ini dilakukan untuk mengelompokkan barisan DNA virus ebola. Proses dimulai dengan mengumpulkan barisan DNA virus ebola yang diambil dari GenBank, kemudian dilakukan ekstraksi ciri menggunakan n-mers frequency. Hasil ekstraksi ciri barisan DNA tersebut dikumpulkan dalam sebuah matriks dan dilakukan normalisasi menggunakan normalisasi min-max dengan interval [0, 1] yang akan digunakan sebagai data masukan. Hasil pengelompokan barisan DNA virus ebola pada penelitian ini diperoleh 8 kelompok dengan nilai MSS (Mean Split Silhouette) minimum 0,50266. Proses clustering pada penelitian ini menggunakan program open source R.

The implementation of k-means partitioning algorithm in HOPACH clustering method in this thesis is used to clustering DNA sequences of ebola viruses. The clustering process is started with collecting DNA sequences of ebola viruses that are taken from GenBank, then performing the extraction of DNA sequences using n-mers frequency. The extraction results are collected as a matrix and normalized using the min-max normalization with interval [0, 1] which will be used as an input data. As the results, we obtained 8 clusters with minimum MSS (Mean Split Silhouette) 0,50266. The clustering process in this thesis is using the open source program R."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
T44900
UI - Tesis Membership  Universitas Indonesia Library