Hasil Pencarian

Ditemukan 102394 dokumen yang sesuai dengan query

Latif Raditya Rusdi

Evaluasi Metode Timesvector Triclustering Menggunakan Gene Ontology pada Data Ekspresi Gen Human Embryonic Stem Cell = Evaluation of TimesVector Triclustering Method Using Gene Ontology on Human Embryonic Stem Cell Gene Expression Data

"Triclustering merupakan salah satu teknik data mining yang bertujuan untuk mengelompokkan data berbentuk tiga dimensi secara simultan. Salah satu pendekatan yang digunakan dalam triclustering adalah pendekatan pattern-based, contohnya Timesvector. Metode timesvector dirancang khusus untuk pengelompokan data deret waktu tiga dimensi yang bertujuan menangkap pola ekspresi gen yang sama atau berbeda antara dua atau lebih kondisi eksperimen. Implementasi metode timesvector dilakukan pada data ekspresi gen human embryonic stem cell (H1-hESC) yang diberi protein morfogenetik tulang (BMP4) dan dikondisikan di dalam ruang dengan tingkat oksigen 4% dan 20, serta diamati pada 6 titik waktu berbeda selama 120 jam. Triclustering dilakukan dengan lima skenario menggunakan cluster sejumlah 257 dan threshold yang berbeda. Berdasarkan skenario tersebut, metode timesvector menghasilkan skenario terbaik pada skenario dengan threshold 1,5 yang menggunakan validasi berdasarkan nilai coverage. Berdasarkan hasil skenario terbaik, dihasilkan 9 pola DEP, 24 pola ODEP, dan 37 pola SEP dan dari pola tersebut dilakukan analisis Gene Ontology (GO) untuk mengukur kualitas tricluster dalam penggambaran konsep GO. Analisis GO menggunakan Database for Annotation, Visualization, and Integrated Discovery (DAVID) tools untuk menghitung nilai p-value. Pada analisis GO dipilih p-value terkecil pada pola DEP, ODEP, dan SEP sebagai tricluster terbaik, yaitu DEP pada tricluster ke 8, ODEP pada tricluster ke-1, dan SEP pada tricluster ke-26. Berdasarkan tricluster terbaik pada pola DEP dan ODEP dapat dikatakan bahwa kondisi oksigen tingkat fisiologis 4 % dan tingkat atmosfer 20 % memiliki perbedaan dalam mengidentifikasi gen kandidat pada H1-hESC yang mampu berdiferensiasi menjadi trofoblas, sedangkan SEP tidak memiliki perbedaan dalam mengidentifikasi gen kandidat pada H1-hESC dengan dua kondisi berbeda.

Triclustering is one of the data mining techniques that aims to cluster three-dimensional data simultaneously. One of the approaches used in triclustering is a pattern-based approach, such as Timesvector. The timesvector method is specifically designed for clustering three-dimensional time series data that aims to capture gene expression patterns that are the same or different between two or more experimental conditions. The implementation of the timesvector method was performed on human embryonic stem cell (H1-hESC) gene expression data treated with bone morphogenetic protein (BMP4) and conditioned in a chamber with 4% and 20 oxygen levels and observed at 6 different time points for 120 hours. Triclustering was performed with five scenarios using 257 clusters and different thresholds. Based on these scenarios, the timesvector method produces the best scenario in the scenario with a threshold of 1.5 which uses validation based on the coverage value. Based on the results of the best scenario, 9 DEP patterns, 24 ODEP patterns, and 37 SEP patterns were generated from these patterns. Gene Ontology (GO) analysis was carried out to measure the quality of the tricluster in describing the GO concept. GO analysis uses Database for Annotation, Visualization, and Integrated Discovery (DAVID) tools to calculate the p-value. In the GO analysis, the smallest p value in the DEP, ODEP, and SEP patterns was selected as the best tricluster, namely DEP in the 8th tricluster, ODEP in the 1st tricluster, and SEP in the 26th tricluster. Based on the best tricluster in the DEP and ODEP patterns, it can be said that the oxygen conditions of 4% physiological level and 20% atmospheric level have differences in identifying candidate genes in H1-hESC that are able to differentiate into trophoblasts, while SEP has no difference in identifying candidate genes in H1-hESC with two different conditions."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Ika Marta Sari

Metode timesvector triclustering dan penerapannya pada data ekspresi gen = Timesvector triclustering method and its application on gene expression data

Analisis triclustering merupakan pengembangan dari analisis clustering dan analisis biclustering. Tujuan dari analisis triclustering yaitu mengelompokkan data tiga dimensi secara simultan atau bersamaan. Data tiga dimensi tersebut dapat berupa observasi, atribut, dan konteks. Salah satu pendekatan yang digunakan dalam analisis triclustering, yaitu pendekatan berdasarkan pattern contohnya, adalah metode Timesvector. Metode Timesvector bertujuan untuk mengelompokkan matriks data yang menunjukkan pola yang sama atau berbeda pada data tiga dimensi. Metode Timesvector memiliki langkah kerja yang dimulai dengan mereduksi matriks data tiga dimensi menjadi matriks data dua dimensi untuk mengurangi kompleksitas dalam pengelompokkan. Pada metode ini akan digunakan algoritma Spherical K-means dalam pengelompokkannya. Tahap selanjutnya, yaitu mengidentifikasi pola dari cluster yang dihasilkan pada Spherical K-means. Pola yang dimaksud terdiri dari tiga jenis, yaitu DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), dan SEP (Similarly Expressed Pattern). Penerapan dari metode Timesvector dilakukan pada data ekspresi gen yaitu data tumor otak yang dilakukan dalam 6 skenario. Masing-masing skenario menggunakan banyak cluster yang sama tetapi nilai threshold yang berbeda-beda. Hasil dari ke enam skenario akan divalidasi menggunakan nilai coverage dan nilai tricluster diffusion (TD). Hasil penerapan metode timesvector menunjukkan bahwa dengan menggunakan threshold sebesar 1,5 memberikan hasil yang paling optimal karena memiliki nilai coverage yang tinggi sebesar 57% dan nilai TD yang rendah sebesar 2,95594E-06. Nilai coverage yang tinggi menunjukkan kemampuan metode dalam mengekstrak data dan nilai TD yang rendah menunjukkan bahwa tricluster yang dihasilkan memiliki volume yang besar dan koherensi yang tinggi. Berdasarkan pola yang dihasilkan menggunakan skenario yang optimal diperoleh sebanyak 49 ODEP cluster dengan pasien ke-empat selalu memiliki pola ekspresi yang berbeda dibandingkan dengan pasien lainya. Hal ini dapat digunakan oleh ahli medis untuk melakukan tindakan selanjutnya terhadap pasien tumor otak.

Triclustering analysis is the development of clustering analysis and biclustering analysis. The purpose of triclustering analysis is to group three-dimensional data simultaneously or simultaneously. The three-dimensional data can be in the form of observations, attributes, and context. One of the approaches used in triclustering analysis, namely an approach based on a pattern, for example, is the Timesvector method. Timesvector method aims to group data matrices that show the same or different patterns in three-dimensional data. The Timesvector method has a work step that starts with reducing the three-dimensional data matrix to a two-dimensional data matrix to reduce complexity in a grouping. In this method, the Spherical K-means algorithm will be used in grouping it. The next step is to identify the pattern of the clusters generated in the Spherical K-means. The pattern referred to consists of three types, namely DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), and SEP (Similar Expressed Pattern). The application of the Timesvector method was carried out on gene expression data, namely brain tumor data carried out in 6 scenarios. Each scenario uses the same many clusters but different threshold values. The results of the six scenarios will be validated using the coverage value and the tricluster diffusion (TD) value. The results of applying the timesvector method show that using a threshold of 1.5 gives the most optimal results because it has a high coverage value of 57% and a low TD value of 2.95594E-06. A high coverage value indicates the method's ability to extract data and a low TD value indicates that the resulting tricluster has a large volume and high coherence. Based on the pattern generated using the optimal scenario, there were 49 ODEP clusters with the fourth patient always having a different expression pattern compared to other patients. This can be used by medical experts to perform further action on brain tumor patients.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Aisyah Gefira

Triclustering dengan Coarse-Grain Parallel Genetic Algorithm Menggunakan Identifikasi Gene Ontology dan KEGG Pathway pada Data Ekspresi Gen Microarray = Triclustering with Coarse-Grain Parallel Genetic Algorithm Using Gene Ontology and KEGG Pathway Identification on Microarray Gene Expression Data

"Teknologi microarray adalah teknologi di bidang bioinformatika yang digunakan untuk mengukur ekspresi gen dalam berbagai kondisi eksperimental dan menghasilkan data ekspresi gen. Salah satu metode yang dapat digunakan untuk menganalisis data ekspresi gen adalah triclustering, Triclustering adalah metode pengelompokan data tiga dimensi berdasarkan karakteristik yang serupa. Berbagai algoritma seperti TriGen, δ-Trimax dan EMOA-δ-Trimax dikembangkan untuk melakukan triclustering. Namun, seluruh algoritma tersebut menghadapi masalah yang sama, yaitu waktu komputasi yang lama. Penelitian ini menggunakan Coarse-grain Parallel Genetic Algorithm (CgPGA) untuk mengatasi tantangan waktu komputasi pada triclustering. Algoritma ini membagi data menjadi beberapa subpopulasi dan menjalankan proses evolusi genetik secara paralel menggunakan enam core. Penelitian ini mengusulkan penggunaan CgPGA untuk mempercepat proses triclustering pada data ekspresi gen darah microarray tiga dimensi yang dipengaruhi empat jenis minuman dan diukur pada lima titik waktu. Kualitas tricluster dievaluasi menggunakan fitness function yang diadaptasi dari Mean Square Residue (MSR), weights, dan distinction. Hasil penelitian ini menunjukkan bahwa CgPGA secara signifikan mengurangi waktu komputasi dengan bekerja 18,24 kali lebih cepat dibandingkan dengan Genetic Algorithm secara serial yang diukur dengan speedup. CgPGA berhasil diterapkan untuk melakukan triclustering pada data ekspresi gen tiga dimensi microarray berdasarkan kemiripan pola ekspresi gen. 10 tricluster yang dihasilkan memiliki kombinasi gen, kondisi, dan waktu yang beragam, serta memiliki fitness score tinggi yang berkisar antara 2514,542745 hingga 2568,106026. Tricluster 5 memiliki fitness score tertinggi yaitu sebesar 2568,106026. Selanjutnya, hasil triclustering dianalisis menggunakan Gene Ontology (GO) dan KEGG Pathway untuk mengidentifikasi informasi gen dan interaksi antar gen di dalam tricluster. Hasil penelitian menunjukkan bahwa GO berhasil mengidentifikasi gen-gen di dalam tricluster dalam aspek proses biologis, fungsi molekuler, dan komponen seluler. Analisis KEGG Pathway menunjukkan bahwa gen-gen di dalam tricluster berpartisipasi dalam berbagai jalur biokimia, salah satunya adalah jalur diabetic cardiomyopathy. Secara keseluruhan, penelitian ini memberikan kontribusi signifikan dalam analisis data genomik dengan mengimplementasikan teknik triclustering menggunakan CgPGA yang efektif dan efisien, serta memperluas pengetahuan tricluster melalui identifikasi informasi genetik yang relevan dan meningkatkan pemahaman tentang interaksi biologis yang terjadi pada suatu kelompok gen berpola ekspresi serupa menggunakan GO dan KEGG Pathway.

Microarray technology is a bioinformatics tool utilized to measure gene expression across various experimental conditions, generating comprehensive gene expression data. Triclustering, a method for clustering three-dimensional data based on similar characteristics, is one approach to analyzing this data. Despite the development of several algorithms for triclustering, such as TriGen, Î´-Trimax, and EMOA-Î´-Trimax, they all encounter the challenge of lengthy computation times. This study addresses this issue by employing the Coarse-grain Parallel Genetic Algorithm (CgPGA). The algorithm mitigates computational time by dividing the data into several subpopulations and executing the genetic evolution process in parallel across six cores. The study demonstrates the application of CgPGA to expedite the triclustering process on three dimensional microarray blood gene expression data, influenced by four types of beverages and measured at five different time points. The triclusters' quality is assessed using a fitness function adapted from Mean Square Residue (MSR), weights, and distinction. Results indicate that CgPGA significantly reduces computation time, operating 18,24 times faster than the serial Genetic Algorithm as measured by speedup. CgPGA effectively performs triclustering on three-dimensional microarray gene expression data. The 10 resulting triclusters exhibit diverse combinations of genes, conditions, and time points, and have high fitness scores ranging from 2514.542745 to 2568.106026. Tricluster 5 has the highest fitness score of 2568.106026. Further analysis of the triclustering results using Gene Ontology (GO) and KEGG Pathway reveals gene information and interactions within the triclusters. GO analysis successfully identifies genes within the triclusters in terms of biological processes, molecular functions, and cellular components, while KEGG Pathway analysis shows that the genes participate in various biochemical pathways, including the diabetic cardiomyopathy pathway. Overall, this study significantly contributes to genomic data analysis by implementing an efficient and effective triclustering technique using CgPGA, expanding the understanding of triclusters by identifying relevant genetic information, and enhancing the comprehension of biological interactions within gene groups exhibiting similar expression patterns using GO and KEGG Pathway."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Teguh Saputra

Metode Triclustering delta-Trimax Melalui Pendekatan Two-Way K-Means Menggunakan Geneontology Data Ekspresi Gen = delta-Trimax Method through Two-Way K-means Approach Using Gene Ontology on Gene Expression Data

Analisis triclustering merupakan teknik yang mampu mengelompokkan data 3 dimensi secara bersamaan, sehingga dapat diperoleh sub-ruang dari data 3D yang terdiri dari subset observasi (gen), subset kondisi (kondisi) dan subset konteks (waktu). Analisis triclustering yang dilakukan pada penelitian ini yaitu metode delta-Trimax melalui pendekatan two-way K-means. Tujuan dari metode delta-Trimax yaitu menemukan tricluster yang memiliki nilai minimum dari three-dimensial mean square residual (ð3) dan volume maksimum. Pendekatan two-way K-means digunakan untuk membentuk suatu populasi awal agar dapat mengurangi beban komputasi dan membantu membentuk tricluster yang lebih baik. Metode ini akan diimplementasikan pada data ekspresi gen kultur HAE (Human Airway Epithelial) yang terinfeksi virus SARS-CoV, SARS-dORF6, SARS-BatSRBD, dan H1N1. Implementasi dilakukan dengan 9 simulasi dan diperoleh simulasi terbaik dengan nilai threshold dari perhitungan MSR sebesar 0.0435, threshold = 1.7 dan sebanyak 24 tricluster terbentuk berdasarkan penilain triclustering quality index (TQI). Dari himpunan tricluster tersebut diperoleh informasi mengenai perbandingan pola ekspresi gen pada virus SARS-CoV, SARS-dORF6, SARS-BatSRBD dengan virus influenza H1N1. Terdapat 7 tricluster yang memiliki kesamaan pola ekspresi gen di setiap kondisi dan 8 tricluster yang diduga memiliki perbedaan kondisi antara setiap variasi virus SARS- CoV dengan virus influenza H1N1. Pada tricluster lainnya juga diperoleh informasi hanya beberapa variasi Sars-CoV yang memiliki kesamaan satu sama lain dan juga kesamaan atau perbedaan dengan H1N1. Berdasarkan titik waktu diperoleh 3 tricluster tidak memberikan efek karena pola ekspresi gen tiap waktu sama dengan kondisi awal yaitu titik waktu ke-1 dan 17 tricluster diduga memberikan efek paska infeksi. Untuk menilai kualitas hasil tricluster terbentuk dalam penggambaran fungsi biologis dari kumpulan gen pada tricluster dilakukan evaluasi gene ontology (GO). GO adalah sebuah sistem untuk menggambarkan fungsi, biological process, celluler componet gen dan moleculer function dalam berbagai organisme. Dari hasil evaluasi diperoleh sebanyak 20 tricluster yang memiliki keterlibatan dan kaitan kuat dengan setiap konsep GO. Sebanyak 3 tricluster hanya memiliki keterlibatan atau kaitan pada salah satu aspek GO dan 1 tricluster yang memiliki keterlibatan pada semua aspek GO namun hanya pada aspek celuller componet yang memiliki kaitan kuat. Hal ini dapat menjadi acuan bagi peneliti bidang biologi untuk memfokuskan penelitian lebih lanjut dalam pemahaman fungsi biologis pada himpunan tricluster yang memiliki keterlibatan dan kaitan kuat.

Triclustering analysis is a technique capable of clustering three-dimensional data simultaneously, thus obtaining subspaces of the 3D data consisting of subsets of observations (genes), attribute subsets (conditions), and context subsets (time). The triclustering analysis conducted in this research utilizes the Î´-Trimax method through a two-way K-means approach. The goal of the Î´-Trimax method is to find triclusters that have minimum values of three-dimensional mean square residu MSR_3D and maximum volume. The two-way K-means approach is used to form an initial population to reduce computational burden and aid in forming better triclusters. This method will be implemented on gene expression data from HAE (Human Airway Epithelial) cultures infected with SARS-CoV, SARS-dORF6, SARS-BatSRBD, and H1N1 viruses. The implementation is carried out through 9 simulations, and the best simulation is obtained with a threshold value of Î´ calculated from MSR of 0.0435, a threshold value of Î»=1.7, resulting in 24 formed triclusters based on the triclustering quality index (TQI) assessment. From the set of triclusters, information regarding the comparison of gene expression patterns between SARS-CoV, SARS-dORF6, SARS-BatSRBD viruses and H1N1 influenza virus is obtained. There are 7 triclusters that exhibit similar gene expression patterns across all conditions, and 8 triclusters that are suspected to have condition differences between various SARS-CoV viruses and the H1N1 virus. Other triclusters also provide information where only certain SARS-CoV variations share similarities with each other or similarities or differences with H1N1. Based on the time points, 3 triclusters show no effect as their gene expression patterns remain the same as the initial condition (time point 1), while 17 triclusters are suspected to have post- infection effects. To assess the quality of the formed triclusters in terms of biological function representation of the gene sets within the triclusters, an evaluation of gene ontology (GO) is performed. GO is a system for describing the functions, biological processes, cellular components, and molecular functions of genes across various organisms. The evaluation method involves the Database for Annotation, Visualization, and Integrated Discovery (DAVID) in calculating p-values. The evaluation results reveal that 20 triclusters have strong involvement and correlation with each GO concept. Three triclusters only exhibit involvement or correlation in one specific aspect of GO, and one tricluster exhibits involvement in all GO aspects, but with a strong correlation only in the cellular component aspect. This information can serve as a reference for researchers in the field of biology to focus further research on understanding the biological functions within tricluster sets that have strong involvement and correlation.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Noval Saputra

Implementasi triclustering menggunakan metode &-trimax pada data ekspresi gen microarray = Triclustering implementation using &-trimax methode on microarray gene expression dataset

Analisis triclustering merupakan teknik analisis pada data 3D (observasi – atribut – konteks). Analisis triclustering dapat mengelompokkan observasi pada beberapa atribut dan konteks secara bersamaan. Analisis triclustering telah sering diterapkan untuk menganalisis data ekspresi gen microarray. Penelitian ini menggunakan metode Î´-Trimax untuk melakukan analisis triclustering pada data ekspresi gen microarray. Metode Î´-Trimax bertujuan untuk menemukan tricluster yang memiliki mean square residual kecil dari Î´ dan volume maksimal. Tricluster diperoleh dengan cara melakukan penghapusan node dari data 3D dengan menggunakan algoritma multiple node deletion dan single node deletion. Kandidat tricluster yang telah didapatkan, dilakukan pengecekan kembali dengan menambahkan beberapa node yang telah dihapus sebelumnya menggunakan algoritma node addition. Pada penelitian ini dilakukan perbaikan program pada metode Î´-Trimax dan juga menambahkan penghitungan evaluasi tricluster yang dihasilkan. Implementasi metode Î´-Trimax dilakukan pada data ekspresi gen dari proses diferensiasi human induced pluripoten stem cell (HiPSC) dari pasien penyakit jantung. Ekspresi gen diukur pada 12 titik waktu dan 3 replikasi. Dari beberapa simulasi yang dilakukan, metode Î´-Trimax memberikan hasil terbaik ketika Î´=0,0068 dan Î»=1,2. Berdasarkan tricluster yang dihasilkan dari simulasi terbaik tersebut, dipilih 5 tricluster yang diduga sebagai ciri-ciri penyakit jantung. Lima tricluster ini dapat menjadi pertimbangan bagi ahli medis untuk melakukan tindakan lebih lanjut terhadap pasien.

Triclustering analysis is an analysis technique on 3D data (observation - attribute - context). Triclustering analysis can group observations on several attributes and contexts simultaneously. Triclustering analysis has been frequently applied to analyze microarray gene expression data. This study used the Î´-Trimax method to perform triclustering analysis on microarray gene expression data. The Î´-Trimax method aims to find a tricluster that has a mean square residual smaller than Î´ and a maximum volume. Tricluster is obtained by deleting nodes from 3D data using multiple node deletion and single node deletion algorithms. The tricluster candidates that have been obtained are checked again by adding some previously deleted nodes using the node addition algorithm. In this research, the program improvement of the Î´-Trimax method was carried out and also the calculation of the resulting tricluster evaluation. The implementation of the Î´-Trimax method was carried out on gene expression data from the differentiation process of human induced pluripotent stem cells (HiPSC) from patients with heart disease. Gene expression was measured at 12 time points and 3 replications. From several simulations performed, the Î´-Trimax method gives the best results when Î´ = 0.0068 and Î» = 1.2. Based on the tricluster generated from the best simulation, 5 tricluster were selected which were suspected as a characteristic of heart disease. These five tricluster can be a consideration for medical experts to take further action on patients.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Nisa Nurul Hidayah

Triclustering Optimal pada Data Ekspresi Gen Penyakit Jantung dengan Menggunakan Metode Triclustering Gabungan Delta-Trimax dengan Fuzzy Cuckoo Search berdasarkan Levy Flight = Optimal Triclustering of Heart Disease Gene Expression Data Using Hybrid Triclustering Method Delta-Trimax with Fuzzy Cuckoo Search Levy

"Triclustering digunakan untuk mengelompokkan data tiga dimensi secara simultan. Metode triclustering yang digunakan pada penelitian ini adalah gabungan ð¿-Trimax dengan Fuzzy Cuckoo search (FCS) berdasarkan LÃ©vy Flight. Data yang digunakan adalah data ekspresi gen dari proses diferensiasi human induced pluripoten stem cell (HiPSC) pada penderita penyakit jantung. Tahap awal adalah mencari populasi solusi tricluster homogen menggunakan metode ð¿-Trimax. Penentuan nilai skala ð¿ untuk menjalankan algoritma pada tahap populasi awal dilakukan menggunakan metode silhouette coefficient. Algoritma ð¿-Trimax yang digunakan pada penelitian ini adalah algoritma Muliple Nodes Deletions dan Single Node Deletions. Tricluster yang didapatkan dari tahap ð¿- Trimax selanjutnya akan dioptimasi menggunakan metode Fuzzy Cuckoo search berdasarkan LÃ©vy Flight. Solusi tricluster yang berpotensi meningkatkan nilai fungsi objektif akan diganti menggunakan local random walk. Kumpulan tricluster yang terbentuk dari tahap optimasi akan dievaluasi menggunakan metode Tricluster Quality Index (TQI). Solusi tricluster terbaik yang diterapkan pada dataset tiga dimensi penyakit jantung didapatkan dari penggunaan nilai skala ð¿ = 0,026 dan ð = 1,7. Solusi tricluster terbaik dianalisis lebih lanjut menggunakan Gene Ontology (GO) untuk menjelaskan keterkaitan gen-gen terhadap proses biologis, fungsi molekuler, dan komponen seluler.

Triclustering is used to group three-dimensional data simultaneously. The triclustering method used in this research is a combination of Î´-Trimax with Fuzzy Cuckoo search (FCS) based on LÃ©vy Flight. The threedimensional data used is gene expression data from the human induced pluripotent stem cell (HiPSC) differentiation process in heart disease sufferers. The initial stage finds a homogeneous population of tricluster solutions using the Î´-Trimax method. Determining the Î´ scale value for running the algorithm at the initial population stage is carried out using the silhouette coefficient method. The Î´-Trimax algorithm used in this research is the Multiple Nodes Deletions and Single Node Deletions algorithms. The tricluster obtained from the Î´-Trimax stage will then be optimized using the Fuzzy Cuckoo search method based on LÃ©vy Flight. The tricluster solution which has the potential to increase the objective function value will be replaced using a local random walk. The tricluster collection formed from the optimization stage will be evaluated using the Tricluster Quality Index (TQI) method. The best tricluster solution applied to a three-dimensional heart disease dataset was obtained from using scale values Î´ = 0,026 and Î¸ = 1,7. The best tricluster solution was further analyzed using Gene Ontology (GO) to explain the relationship of genes to biological processes, molecular functions, and cellular components.
"

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Dea Siska

Analisis triclustering menggunakan algoritma order preserving triclustering (OPTricluster) dan implementasinya pada data ekspresi gen = Analysis of triclustering using order preserving triclustering (OPTricluster) algorithm and its implementation on gene expression data

"Metode triclustering merupakan pengembangan dari metode clustering dan biclustering. Berbeda dengan metode clustering dan biclustering yang bekerja pada data dua dimensi, triclustering bekerja pada data tiga dimensi yang disusun dalam bentuk matriks. Matriks ini terdiri dari dimensi observasi, atribut, dan konteks. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara simultan dan membentuk kelompok berupa subruang yang disebut tricluster. Metode ini umumnya diimplementasikan dalam bidang bioinformatika, terkhususnya dalam analisis data ekspresi gen tiga dimensi untuk menemukan profil ekspresi gen. Data atau matriks ini terdiri dari dimensi gen, kondisi eksperimen, dan waktu eksperimen (time point).

Salah satu algoritma triclustering, yaitu Order Preserving Triclustering (OPTricluster), adalah algoritma yang menggunakan pendekatan pattern based dan digunakan untuk menganalisis data ekspresi gen tiga dimensi yang merupakan short time series 3-8 time point). OPTricluster membentuk tricluster dengan mengidentifikasi gen-gen yang memiliki perubahan ekspresi yang sama di sepanjang time points pada sejumlah kondisi eksperimen.

Dalam penelitian ini, OPTricluster diimplementasikan pada data ekspresi gen sejumlah pasien yellow fever pasca vaksinasi dengan beberapa skenario yang menggunakan threshold yang berbeda-beda. Skenario dengan threshold yang optimum ditunjukkan oleh rata-rata skor Tricluster Diffusion terendah. Tricluster-tricluster yang dihasilkan berhasil menunjukkan hubungan biologis di antara pasien-pasien tersebut, di mana vaksin cenderung memberikan reaksi yang lebih signifikan pada pasien pria dibandingkan pasien wanita. Selain itu, ditemukan anomali pada pasien-pasien tersebut.

Triclustering method is the development of clustering method and biclustering method. Unlike clustering and biclustering that works on two-dimensional data, triclustering works on three-dimensional data that arranged in the form of a matrix consisting of observations, attributes, and contexts dimensions. Triclustering is able to group these dimensions simultaneously and form a subspace called a tricluster. This method is generally implemented in analysis of three-dimensional gene expression data to find profiles of gene expression. This data or matrix consists of genes, experimental conditions and time points dimensions.
One of the triclustering algorithms, Order Preserving Triclustering (OPTricluster), is an algorithm that uses a pattern-based approach and used to analyze short time series data (3-8 time points). The OPTricluster forms the tricluster by identifying genes that have the same expression change across time points under a number of experimental conditions. The change in expression is expressed in a rank pattern which is divided based on three types of patterns, namely constant, conserved and divergent patterns.
In this study, OPTricluster was implemented in gene expression data of yellow fever patients after vaccination using several scenarios with different thresholds. The scenario with the optimum threshold is indicated by the lowest average Tricluster Diffusion score. The resulting triclusters were successful in showing biological relationships among these patients, where the vaccine tending to have a more significant reaction in male patients than in female patients. In addition, anomalies were found in these patients."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Stefany Nurhatika

Mengombinasikan Metode δ – Trimax dengan Metode Timesvector pada Data Ekspresi Gen Tiga Dimensi = Combining Î´ -Trimax Method with Timesvector Method on Three-Dimensional Gene Expression Data

Analisis triclustering merupakan pengembangan dari analisis clustering dan biclustering. Analisis triclustering bertujuan mengelompokkan data tiga dimensi secara simultan yang menghasilkan submatriks dinamakan tricluster. Pendekatan yang digunakan dalam analisis triclustering di antaranya adalah pendekatan berdasarkan greedy dan pattern. Salah satu contoh pendekatan analisis triclustering berdasarkan greedy adalah metode Î´ – Trimax. Sedangkan salah satu contoh analisis triclustering berdasarkan pattern adalah metode Timesvector. Metode Î´ – Trimax bertujuan menghasilkan tricluster yang memiliki mean square residual kecil dari threshold dengan volume data tricluster yang maksimal. Metode Timesvector bertujuan mengelompokkan matriks data yang menunjukkan pola yang sama atau berbeda pada data tiga dimensi. Implementasi metode Î´ – Trimax dan metode Timesvector pada penelitian ini dilakukan pada data ekspresi gen pasien penderita penyakit periodontitis. Ekspresi gen diukur pada 14 titik kondisi dan 4 titik waktu. Berdasarkan beberapa skenario yang telah diterapkan, metode Î´ – Trimax memberikan hasil terbaik pada saat menerapkan skenario dengan nilai threshold =0,0028564 dan =1,25 dengan jumlah tricluster yang dihasilkan adalah 260 tricluster. Dari 260 tricluster tersebut, dipilih tricluster ke-216 yang dianalisis dengan menggunakan metode Timesvector. Hasil tricluster yang diperoleh dapat menambah wawasan bagi ahli medis dalam memberikan periodontal treatment kepada pasien penderita periodontitis berikutnya.

Triclustering analysis is the development of clustering and biclustering. Triclustering analysis aims to group three-dimensional data simultaneously, forming the initial subspace known as a tricluster. It utilizes two main approaches that are greedy-based and pattern-based approaches, exemplified by the Î´ – Trimax and Timesvector methods, respectively. The Î´ – Trimax method aims for triclusters with smaller mean square residuals than the threshold Î´, while Timesvector groups data matrices with similar or different patterns. In a study on periodontitis patients gene expression data, comprising 14 condition points and 4 time points, both methods were implemented. The Î´ – Trimax method yielded optimal results under specific conditions (Î´ = 0.0028564, Î» = 1.25), producing 260 triclusters. Among these, the 216th tricluster was selected for further analysis using the Timesvector method. The insights gained from these triclusters can enhance periodontal treatment strategies for patients with subsequent periodontitis, providing valuable guidance to medical experts.

"

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Akira Andriani

Implementasi Triclustering Menggunakan Metode Fuzzy Cuckoo Search berdasarkan Distribusi Gaussian pada Data Ekspresi Gen = The Implementation of Triclustering using Fuzzy Cuckoo Search Based on Gaussian Distribution on Gene Expression Data

"Analisis clustering merupakan proses pengelompokan yang bertujuan untuk menemukan kelompok atau cluster yang didalamnya memiliki karakteristik yang serupa. Seiring berjalannya waktu, teknik clustering berkembang menjadi biclustering dan triclustering, di mana dalam triclustering data yang digunakan adalah data tiga dimensi. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara bersamaan yang nantinya kelompok yang dihasilkan disebut dengan tricluster. Pada penelitian ini, digunakan metode Fuzzy Cuckoo Search (FCS) untuk mengimplementasikan triclustering pada data ekspresi gen tiga dimensi. FCS mengaplikasikan konsep Fuzzy C-Means (FCM) ke dalam algoritma cuckoo search. Penggunaan fungsi objektif FCM dalam FCS dapat mengatasi ketidakjelasan (uncertainty) dalam data, khususnya pada data ekspresi gen. Dalam metode cuckoo search, pencarian ‘solusi’ tricluster digambarkan dengan spesies cuckoo yang meletakkan telur di sarang burung lain. Berbeda dengan cuckoo search pada umumnya yang menggunakan metode random walk levy flight untuk pencarian solusi, pada penelitian ini, digunakan metode lain, yaitu metode random walk distribusi gaussian, di mana hal tersebut merupakan sebuah kebaruan dalam penelitian ini. Cuckoo search dalam metode FCS merupakan metode metaheuristik, sehingga dapat digunakan dalam berbagai masalah analisis data, termasuk data ekspresi gen. Metode FCS berdasarkan distribusi gaussian diimplementasikan pada data ekspresi gen tiga dimensi dari gen otot rangka yang diberi infus IL-6, di mana ekspresi gen diamati pada 3 subjek dan 3 titik waktu yang berbeda. Metode ini dievaluasi menggunakan ukuran evaluasi Triclustering Quality Index (TQI). Dari skenario yang dilakukan, metode FCS memberikan hasil terbaik dengan rata-rata TQI terendah ketika menggunakan nilai gaussian dan probabilitas . Hasil implementasi metode FCS menunjukkan 4 tricluster yang diduga sebagai kumpulan gen yang berekspresi atas respon dari IL-6. Kelompok gen yang diperoleh dari tricluster dapat digunakan sebagai target oleh ahli medis dalam pengembangan di bidang pengobatan penyakit seperti kanker, diabetes, paru-paru, atau gagal jantung yang menargetkan gen-gen dalam kelompok tricluster tersebut.

Clustering analysis is a grouping process that aims to find clusters such that objects in the same clusters have similar characteristics. Over time, clustering developed into biclustering and triclustering, wherein triclustering use three-dimensional dataset. Triclustering is able to group these three dimensions simultaneously and form groups called tricluster. This study used the Fuzzy Cuckoo Search (FCS) method to implement triclustering on three-dimensional gene expression data. FCS applies the Fuzzy C-means (FCM) concept to the cuckoo search algorithm. The use of the objective function of FCM in FCS can overcome the uncertainty in the data, especially in gene expression data. In the cuckoo search, finding the tricluster is described with cuckoo species laying their egg in the nests of other birds. The egg laid on the nest represents a 'solution' which is an update of the tricluster from the previous tricluster. Unlike cuckoo search in general, in this study, to find the tricluster solutions, it use gaussian random walk instead of levy flight random walk. Cuckoo search in the FCS method is a metaheuristic method, so it can be used in various data analysis problems, including gene expression data. FCS based on Gaussian distribution was implemented on three-dimensional gene expression data of skeletal muscle genes given IL-6 infusion, where the gene expression was observed in 3 subjects and 3 different time points. Of the 36 simulations performed, the FCS method gives the best results with the lowest average TQI when using gaussian values and probability . This method was evaluated using the Triclustering Quality Index (TQI) evaluation measure. The result of the implementation of FCS shows 4 triclusters which were suspected to be a collection of genes that change in response to IL-6. The gene groups obtained from the tricluster can be used as a consideration by medical professionals in the development of the treatment of diseases such as cancer, diabetes, pulmonary disease, or heart failure that target the genes in the tricluster group."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Muhammad Fabian Alkautsar

Metode Delta Trimax dengan Silhouette Coefficient dan Genetic Algorithm Optimization Menggunakan Analisis Gene Ontology pada Data Ekspresi Gen Tiga Dimensi = Delta Trimax Method with Silhouette Coefficient and Genetic Algorithm Optimization Using Gene Ontology Analysis on Three-Dimensional Gene Expression Data

"Analisis triclustering adalah metode data mining yang memiliki tujuan untuk mengelompokkan data tiga dimensi. Metode ini kerap kali digunakan untuk bidang bioinformatika. Pada penelitian ini digunakan metode analisis triclustering delta trimax. Delta Trimax pada intinya adalah metode analisis triclustering yang bertujuan untuk menemukan tricluster yang memiliki nilai MSR yang lebih kecil dari nilai threshold (o) yang telah ditentukan. Penggunaan silhouette coefficient pada penelitian ini adalah untuk membantu menentukan nilai threshold (o) tersebut. Hasil triclustering delta trimax nantinya dievaluasi dengan menggunakan Triclustering Quality Index (TQI). Genetic algorithm (GA) adalah sebuah algoritma pencarian yang efisien yang didasari oleh evolusi biologis dan genetika alam. Algoritma GA digunakan untuk menemukan solusi terbaik. Terdapat tiga operator genetika yang digunakan di dalam GA, yaitu seleksi, crossover, dan mutasi. Pada penelitian ini, digunakan data ekspresi gen tiga dimensi dari sel kanker paru-paru fase stabil (A549) yang diberi perlakuan obat kemoterapi Motexafin Gadolinium (MGd) dan mannitol sebagai grup kontrol, dimana ekspresi gen diamati dalam 6 kondisi dan 3 titik waktu. Tujuan dari penelitian ini adalah untuk mengetahui apa kumpulan gen yang memiliki respon baik terhadap pemberian obat kemoterapi MGd dan kondisi apa yang mempengaruhinya. Pada penelitian ini, himpunan tricluster yang memiliki kualitas terbaik berdasarkan Triclustering Quality Index (TQI) adalah himpunan tricluster yang dihasilkan dengan nilai o = 0,004. Berdasarkan himpunan tricluster tersebut, didapatkan informasi penting mengenai kumpulan gen yang memiliki respon baik terhadap pemberian MGd tapi efek obat MGd tidak bertahan di setiap titik waktu. Terdapat juga gen yang menunjukkan respon baik pemberian obat kemoterapi MGd, tetapi efektivitasnya tidak terlalu maksimal karena responnya beririsan dengan subjek yang hanya diberikan mannitol. Setelah itu, dilihat bagaimana hubungan gen yang berasal dari keseluruhan dataset dengan penyakit melalui gene ontology sebagai informasi tambahan untuk perkembangan obat MGd. Nilai fold enrichment tertinggi pada GO biological process adalah Cytoplasmic Translation, pada GO Cellular Component adalah cytosolic ribosome, dan pada GO Molecular Function adalah structural constituent of ribosome.

Triclustering analysis is a data mining method aimed at grouping three-dimensional data. This method is often used in the field of bioinformatics. In this study, the delta trimax triclustering analysis method is used. Delta Trimax essentially aims to find triclusters with Mean Squared Residue (MSR) values smaller than a predetermined threshold (o). The silhouette coefficient is used in this study to help determine the threshold (o). The results of the delta trimax triclustering are then evaluated using the Triclustering Quality Index (TQI). The genetic algorithm (GA) is an efficient search algorithm based on biological evolution and natural genetics. GA is used to find the best solution. There are three genetic operators used in GA: selection, crossover, and mutation. In this study, three-dimensional gene expression data from stable phase lung cancer cells (A549) treated with the chemotherapy drug Motexafin Gadolinium (MGd) and mannitol as a control group were used, where gene expression was observed under 6 conditions and 3 time points. The aim of this study is to identify which sets of genes respond well to MGd chemotherapy and which conditions influence these responses. The set of triclusters with the highest quality based on the Triclustering Quality Index (TQI) was obtained with o=0.004. From this set of triclusters, important information was obtained about the sets of genes that respond well to MGd, but the effect of MGd does not persist at every time point. There are also genes that show a good response to MGd chemotherapy, but its effectiveness is not maximized because the response overlaps with subjects that were only given mannitol. Subsequently, the relationship between genes from the entire dataset and the disease is observed through gene ontology as additional information for the development of MGd drugs. The highest fold enrichment value in the GO biological process is Cytoplasmic Translation, in the GO Cellular Component is cytosolic ribosome, and in the GO Molecular Function is structural constituent of ribosome."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian