Search Result  ::  Save as CSV :: Back

Search Result

Found 4 Document(s) match with the query
cover
Dwi Aji Apriana
"Triclustering merupakan salah satu metode data mining yang juga merupakan pengembangan dari metode biclustering dan clustering. Metode tersebut mengelompokkan set data berupa matriks tiga dimensi (gen, kondisi, dan waktu) menjadi kelompok-kelompok submatriks yang memiliki kesamaan satu sama lain. Salah satu algoritma dari analisis triclustering adalah Extended Dimension Iterative Signature Algorithm (EDISA). Algoritma ini mempertimbangkan jarak Pearson antara tiap gen dan kondisi terhadap vektor rata-rata sebagai ukuran kemiripan. Proses pertama dari EDISA adalah langkah preprocessing yaitu menghapus gen yang memiliki nilai ekspresi gen yang berbeda sangat signifikan dengan nilai ekspresi gen lainnya. Lalu langkah selanjutnya yaitu memilih sebanyak s sampel gen dengan cara memilih satu gen secara random untuk menjadi seed gen, lalu mencari sebanyak s-1 gen yang memiliki jarak Pearson terdekat dengan seed gen tersebut. Tahap berikutnya membuat vektor bobot gen dan kondisi, lalu memasangkannya dengan sampel gen yang telah terpilih, kemudian menghitung vektor rata-ratanya. Proses selanjutnya yaitu proses iterasi di mana setiap gen dan kondisi yang memiliki jarak Pearson terhadap vektor rata-rata di atas ambang batas tertentu (TG dan TG, keduanya merupakan ukuran seberapa baik keselarasan suatu gen dan kondisi terhadap rata-rata kandidat tricluster) harus dihapus karena dianggap tidak memiliki kemiripan yang cukup dengan anggota tricluster lain pada setiap iterasinya. Proses selanjutnya adalah postprocessing yang bertujuan untuk menggabungkan tricluster yang memiliki kemiripan untuk dijadikan tricluster yang lebih besar dan dijadikan sebagai kumpulan tricluster final. Algoritma ini diterapkan pada data ekspresi gen penyakit paru-paru. Penerapan algoritma tersebut menggunakan beberapa skenario dengan nilai Tg dan TG yang berbeda. Hasil dari penerapan pada data ekspresi gen penyakit paru-paru diperoleh bahwa semakin besar nilai TG, maka jumlah gen yang dapat masuk ke dalam tricluster makin banyak, dan semakin besar nilai TG, maka jumlah kondisi yang dapat masuk ke dalam tricluster juga makin banyak. Selain itu, dilakukan evaluasi dari tricluster menggunakan nilai Tricluster Diffusion Score (TD Score) untuk mencari skenario terbaik. Didapat bahwa skenario terbaik merupakan skenario dengan nilai Tg=0,3 dan nilai TG=0,2. Melalui algoritma ini dapat dideteksi gen-gen yang dapat membedakan karakteristik pasien yang berpenyakit paru-paru dan pasien yang sehat."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Akira Andriani
"Analisis clustering merupakan proses pengelompokan yang bertujuan untuk menemukan kelompok atau cluster yang didalamnya memiliki karakteristik yang serupa. Seiring berjalannya waktu, teknik clustering berkembang menjadi biclustering dan triclustering, di mana dalam triclustering data yang digunakan adalah data tiga dimensi. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara bersamaan yang nantinya kelompok yang dihasilkan disebut dengan tricluster. Pada penelitian ini, digunakan metode Fuzzy Cuckoo Search (FCS) untuk mengimplementasikan triclustering pada data ekspresi gen tiga dimensi. FCS mengaplikasikan konsep Fuzzy C-Means (FCM) ke dalam algoritma cuckoo search. Penggunaan fungsi objektif FCM dalam FCS dapat mengatasi ketidakjelasan (uncertainty) dalam data, khususnya pada data ekspresi gen. Dalam metode cuckoo search, pencarian ‘solusi’ tricluster digambarkan dengan spesies cuckoo yang meletakkan telur di sarang burung lain. Berbeda dengan cuckoo search pada umumnya yang menggunakan metode random walk levy flight untuk pencarian solusi, pada penelitian ini, digunakan metode lain, yaitu metode random walk distribusi gaussian, di mana hal tersebut merupakan sebuah kebaruan dalam penelitian ini. Cuckoo search dalam metode FCS merupakan metode metaheuristik, sehingga dapat digunakan dalam berbagai masalah analisis data, termasuk data ekspresi gen. Metode FCS berdasarkan distribusi gaussian diimplementasikan pada data ekspresi gen tiga dimensi dari gen otot rangka yang diberi infus IL-6, di mana ekspresi gen diamati pada 3 subjek dan 3 titik waktu yang berbeda. Metode ini dievaluasi menggunakan ukuran evaluasi Triclustering Quality Index (TQI). Dari skenario yang dilakukan, metode FCS memberikan hasil terbaik dengan rata-rata TQI terendah ketika menggunakan nilai gaussian dan probabilitas . Hasil implementasi metode FCS menunjukkan 4 tricluster yang diduga sebagai kumpulan gen yang berekspresi atas respon dari IL-6. Kelompok gen yang diperoleh dari tricluster dapat digunakan sebagai target oleh ahli medis dalam pengembangan di bidang pengobatan penyakit seperti kanker, diabetes, paru-paru, atau gagal jantung yang menargetkan gen-gen dalam kelompok tricluster tersebut.

Clustering analysis is a grouping process that aims to find clusters such that objects in the same clusters have similar characteristics. Over time, clustering developed into biclustering and triclustering, wherein triclustering use three-dimensional dataset. Triclustering is able to group these three dimensions simultaneously and form groups called tricluster. This study used the Fuzzy Cuckoo Search (FCS) method to implement triclustering on three-dimensional gene expression data. FCS applies the Fuzzy C-means (FCM) concept to the cuckoo search algorithm. The use of the objective function of FCM in FCS can overcome the uncertainty in the data, especially in gene expression data. In the cuckoo search, finding the tricluster is described with cuckoo species laying their egg in the nests of other birds. The egg laid on the nest represents a 'solution' which is an update of the tricluster from the previous tricluster. Unlike cuckoo search in general, in this study, to find the tricluster solutions, it use gaussian random walk instead of levy flight random walk. Cuckoo search in the FCS method is a metaheuristic method, so it can be used in various data analysis problems, including gene expression data. FCS based on Gaussian distribution was implemented on three-dimensional gene expression data of skeletal muscle genes given IL-6 infusion, where the gene expression was observed in 3 subjects and 3 different time points. Of the 36 simulations performed, the FCS method gives the best results with the lowest average TQI when using gaussian values and probability . This method was evaluated using the Triclustering Quality Index (TQI) evaluation measure. The result of the implementation of FCS shows 4 triclusters which were suspected to be a collection of genes that change in response to IL-6. The gene groups obtained from the tricluster can be used as a consideration by medical professionals in the development of the treatment of diseases such as cancer, diabetes, pulmonary disease, or heart failure that target the genes in the tricluster group."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dea Siska
"Metode triclustering merupakan pengembangan dari metode clustering dan biclustering. Berbeda dengan  metode clustering dan biclustering yang bekerja pada data dua dimensi, triclustering bekerja pada data tiga dimensi yang disusun dalam bentuk matriks. Matriks ini terdiri dari dimensi observasi, atribut, dan konteks. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara simultan dan membentuk kelompok berupa subruang yang disebut tricluster. Metode ini umumnya diimplementasikan dalam bidang bioinformatika, terkhususnya dalam analisis data ekspresi gen tiga dimensi untuk menemukan profil ekspresi gen. Data atau matriks ini terdiri dari dimensi gen, kondisi eksperimen, dan waktu eksperimen (time point).
Salah satu algoritma triclustering, yaitu Order Preserving Triclustering (OPTricluster), adalah algoritma yang menggunakan pendekatan pattern based dan digunakan untuk menganalisis data ekspresi gen tiga dimensi yang merupakan short time series 3-8 time point). OPTricluster membentuk tricluster dengan mengidentifikasi gen-gen yang memiliki perubahan ekspresi yang sama di sepanjang time points pada sejumlah kondisi eksperimen.
Dalam penelitian ini, OPTricluster diimplementasikan pada data ekspresi gen sejumlah pasien yellow fever pasca vaksinasi dengan beberapa skenario yang menggunakan threshold yang berbeda-beda. Skenario dengan threshold yang optimum ditunjukkan oleh rata-rata skor Tricluster Diffusion terendah. Tricluster-tricluster yang dihasilkan berhasil menunjukkan hubungan biologis di antara pasien-pasien tersebut, di mana vaksin cenderung memberikan reaksi yang lebih signifikan pada pasien pria dibandingkan pasien wanita. Selain itu, ditemukan anomali pada pasien-pasien tersebut.

Triclustering method is the development of clustering method and biclustering method. Unlike clustering and biclustering that works on two-dimensional data, triclustering works on three-dimensional data that arranged in the form of a matrix consisting of observations, attributes, and contexts dimensions. Triclustering is able to group these dimensions simultaneously and form a subspace called a tricluster. This method is generally implemented in analysis of three-dimensional gene expression data to find profiles of gene expression. This data or matrix consists of genes, experimental conditions and time points dimensions.
One of the triclustering algorithms, Order Preserving Triclustering (OPTricluster), is an algorithm that uses a pattern-based approach and used to analyze short time series data (3-8 time points). The OPTricluster forms the tricluster by identifying genes that have the same expression change across time points under a number of experimental conditions. The change in expression is expressed in a rank pattern which is divided based on three types of patterns, namely constant, conserved and divergent patterns.
In this study, OPTricluster was implemented in gene expression data of yellow fever patients after vaccination using several scenarios with different thresholds. The scenario with the optimum threshold is indicated by the lowest average Tricluster Diffusion score. The resulting triclusters were successful in showing biological relationships among these patients, where the vaccine tending to have a more significant reaction in male patients than in female patients. In addition, anomalies were found in these patients.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Almaira Nabila Ayudhiya
"Saat ini, minat terhadap analisis data ekspresi gen telah meningkat pesat. Hal ini dikarenakan analisis informasi yang dihasilkan dari analisis data ekspresi gen dapat memungkinkan untuk menemukan fenomena biologis tertentu. Teknik clustering merupakan teknik yang telah banyak diaplikasikan sebagai alat untuk memahami informasi dalam data ekspresi gen. Seiring berkembangnya teknologi, digunakan teknik triclustering dalam banyak analisis biologis lainnya, tetapi belum ada satupun dari analisis ini yang memperhitungkan peran kromosom. Terdapat sumber yang menyatakan bahwa data ekspresi gen dikendalikan oleh elemen pengatur yang dapat berlokasi di sepanjang kromosom, bahkan dalam beberapa kasus juga dapat berlokasi di kromosom lain. Elemen pengatur yang dimaksud adalah suatu protein yang dihasilkan oleh gen regulator, yaitu gen yang produk ekspresinya berperan mengatur ekspresi gen lain. Pada penelitian ini diperhitungkan identitas kromosom dari setiap gen sebelum dilakukannya clustering, dengan cara membentuk struktur tiga dimensi, yaitu kromosom-gen-observasi. Struktur ini disebut sebagai kubus gen. Pendekatan kubus gen ini diimplementasikan pada data ekspresi gen penyakit kanker kandung kemih. Untuk menguji apakah struktur kubus gen ini dapat memberikan informasi yang diinginkan dengan cara menemukan pola pada ekspresi gen, diterapkan metode K-means clustering yang langkah awalnya dioptimasi menggunakan algoritma K-means++ dan metode Delta-Trimax triclustering. Metode K-means clustering menghasilkan cluster-cluster yang optimal dengan indeks Davies Bouldin yang rendah pada sumbu gen, sumbu observasi, dan sumbu kromosom. Sedangkan, metode Delta-Trimax triclustering menghasilkan tricluster-tricluster optimal dengan menggunakan threshold terbaik yang diperoleh berdasarkan nilai tricluster diffusion terkecil. Tricluster ini dapat menjadi pertimbangan bagi ahli medis untuk digunakan sebagai target terapi. Struktur kubus gen terbukti dapat memberikan informasi yang diinginkan menggunakan sudut pandang baru, yaitu berupa dimensi kromosom.

Nowadays, the interest in gene expression data analysis has grown rapidly. This is because the analysis of information generated from gene expression data analysis has enabled the founding of biological phenomenon. As how the data itself is reasoned, the clustering approach has become a technique that has been widely applied in understanding gene expression data. As technology advances, the triclustering technique has been used for many biological analysis, but none has yet taken the role of chromosomes into account. There are sources claiming that the expression of gene data is controlled by regulatory elements which can be located alongside a chromosome, in some cases, even located on another chromosome. Said regulatory elements are proteins produced by a gene regulator, namely genes whose expression products play a role in regulating the expression of other genes. In this study, the chromosome identity of each gene was accounted before doing clustering, which was done by forming a three-dimensional structure, i.e. chromosome-gene-observation. The structure is known as gene cube. This gene cube approach is implemented in the expression of bladder cancer gene data. To find out whether the cube structure of this gene can provide the desired information through finding the pattern of gene expression, K-means clustering which initial step is optimized using the K-means++ algorithm and Delta-Trimax triclustering method are applied. The K-means clustering method produces optimal clusters with small value of Davies Bouldin index on the gene axis, observation axis, and chromosome axis. Meanwhile, the Delta-Trimax triclustering method produces optimal triclusters using the best threshold obtained based on the smallest value of tricluster diffusion. This tricluster can be a consideration for medical experts to be used as therapy target. The gene cube structure has been shown to provide the desired information from a new perspective, namely the dimensions of chromosome."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library