Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 3 dokumen yang sesuai dengan query
cover
Teguh Saputra
"

Analisis triclustering merupakan teknik yang mampu mengelompokkan data 3 dimensi secara bersamaan, sehingga dapat diperoleh sub-ruang dari data 3D yang terdiri dari subset observasi (gen), subset kondisi (kondisi) dan subset konteks (waktu). Analisis triclustering  yang  dilakukan  pada  penelitian  ini  yaitu  metode delta-Trimax melalui pendekatan   two-way   K-means.   Tujuan   dari   metode delta-Trimax yaitu menemukan tricluster yang memiliki nilai minimum dari three-dimensial mean square residual (𝑆3) dan volume maksimum. Pendekatan two-way K-means digunakan untuk membentuk suatu populasi awal agar dapat mengurangi beban komputasi dan membantu membentuk tricluster yang lebih baik. Metode ini akan diimplementasikan pada data ekspresi gen kultur HAE (Human Airway Epithelial) yang terinfeksi virus SARS-CoV, SARS-dORF6, SARS-BatSRBD, dan H1N1. Implementasi dilakukan dengan 9 simulasi dan diperoleh simulasi terbaik dengan nilai threshold dari perhitungan MSR sebesar 0.0435, threshold  = 1.7 dan sebanyak 24 tricluster terbentuk berdasarkan penilain triclustering quality index (TQI). Dari himpunan tricluster tersebut diperoleh informasi mengenai perbandingan pola ekspresi gen pada virus SARS-CoV, SARS-dORF6, SARS-BatSRBD dengan virus influenza H1N1. Terdapat 7 tricluster yang memiliki kesamaan pola ekspresi gen di setiap kondisi dan 8 tricluster yang diduga memiliki perbedaan kondisi antara setiap variasi virus SARS- CoV dengan virus influenza H1N1. Pada tricluster lainnya juga diperoleh informasi hanya beberapa variasi Sars-CoV yang memiliki kesamaan satu sama lain dan juga kesamaan atau perbedaan dengan H1N1. Berdasarkan titik waktu diperoleh 3 tricluster tidak memberikan efek karena pola ekspresi gen tiap waktu sama dengan kondisi awal yaitu titik waktu ke-1 dan 17 tricluster diduga memberikan efek paska infeksi. Untuk menilai kualitas hasil tricluster terbentuk dalam penggambaran fungsi biologis dari kumpulan gen pada tricluster dilakukan evaluasi gene ontology (GO). GO adalah sebuah sistem untuk menggambarkan fungsi, biological process, celluler componet gen dan moleculer function dalam berbagai organisme. Dari hasil evaluasi diperoleh sebanyak 20 tricluster yang memiliki keterlibatan dan kaitan kuat dengan setiap konsep GO. Sebanyak 3 tricluster hanya memiliki keterlibatan atau kaitan pada salah satu aspek GO dan 1 tricluster yang memiliki keterlibatan pada semua aspek GO namun hanya pada aspek celuller componet yang memiliki kaitan kuat. Hal ini dapat menjadi acuan bagi peneliti bidang biologi untuk memfokuskan penelitian lebih lanjut dalam pemahaman fungsi biologis pada himpunan tricluster yang memiliki keterlibatan dan kaitan kuat.


Triclustering analysis is a technique capable of clustering three-dimensional data simultaneously, thus obtaining subspaces of the 3D data consisting of subsets of observations (genes), attribute subsets (conditions), and context subsets (time). The triclustering analysis conducted in this research utilizes the δ-Trimax method through a two-way K-means approach. The goal of the δ-Trimax method is to find triclusters that have minimum values of three-dimensional mean square residu MSR_3D and maximum volume. The two-way K-means approach is used to form an initial population to reduce computational burden and aid in forming better triclusters. This method will be implemented on gene expression data from HAE (Human Airway Epithelial) cultures infected with SARS-CoV, SARS-dORF6, SARS-BatSRBD, and H1N1 viruses. The implementation is carried out through 9 simulations, and the best simulation is obtained with a threshold value of δ calculated from MSR of 0.0435, a threshold value of λ=1.7, resulting in 24 formed triclusters based on the triclustering quality index (TQI) assessment. From the set of triclusters, information regarding the comparison of gene expression patterns between SARS-CoV, SARS-dORF6, SARS-BatSRBD viruses and H1N1 influenza virus is obtained. There are 7 triclusters that exhibit similar gene expression patterns across all conditions, and 8 triclusters that are suspected to have condition differences between various SARS-CoV viruses and the H1N1 virus. Other triclusters also provide information where only certain SARS-CoV variations share similarities with each other or similarities or differences with H1N1. Based on the time points, 3 triclusters show no effect as their gene expression patterns remain the same as the initial condition (time point 1), while 17 triclusters are suspected to have post- infection effects. To assess the quality of the formed triclusters in terms of biological function representation of the gene sets within the triclusters, an evaluation of gene ontology (GO) is performed. GO is a system for describing the functions, biological processes, cellular components, and molecular functions of genes across various organisms. The evaluation method involves the Database for Annotation, Visualization, and Integrated Discovery (DAVID) in calculating p-values. The evaluation results reveal that 20 triclusters have strong involvement and correlation with each GO concept. Three triclusters only exhibit involvement or correlation in one specific aspect of GO, and one tricluster exhibits involvement in all GO aspects, but with a strong correlation only in the cellular component aspect. This information can serve as a reference for researchers in the field of biology to focus further research on understanding the biological functions within tricluster sets that have strong involvement and correlation.

"
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Teguh Saputra
"

Analisis triclustering merupakan teknik yang mampu mengelompokkan data 3 dimensi secara bersamaan, sehingga dapat diperoleh sub-ruang dari data 3D yang terdiri dari subset observasi (gen), subset kondisi (kondisi) dan subset konteks (waktu). Analisis triclustering  yang  dilakukan  pada  penelitian  ini  yaitu  metode delta-Trimax melalui pendekatan   two-way   K-means.   Tujuan   dari   metode delta-Trimax yaitu menemukan tricluster yang memiliki nilai minimum dari three-dimensial mean square residual (𝑆3) dan volume maksimum. Pendekatan two-way K-means digunakan untuk membentuk suatu populasi awal agar dapat mengurangi beban komputasi dan membantu membentuk tricluster yang lebih baik. Metode ini akan diimplementasikan pada data ekspresi gen kultur HAE (Human Airway Epithelial) yang terinfeksi virus SARS-CoV, SARS-dORF6, SARS-BatSRBD, dan H1N1. Implementasi dilakukan dengan 9 simulasi dan diperoleh simulasi terbaik dengan nilai threshold dari perhitungan MSR sebesar 0.0435, threshold  = 1.7 dan sebanyak 24 tricluster terbentuk berdasarkan penilain triclustering quality index (TQI). Dari himpunan tricluster tersebut diperoleh informasi mengenai perbandingan pola ekspresi gen pada virus SARS-CoV, SARS-dORF6, SARS-BatSRBD dengan virus influenza H1N1. Terdapat 7 tricluster yang memiliki kesamaan pola ekspresi gen di setiap kondisi dan 8 tricluster yang diduga memiliki perbedaan kondisi antara setiap variasi virus SARS- CoV dengan virus influenza H1N1. Pada tricluster lainnya juga diperoleh informasi hanya beberapa variasi Sars-CoV yang memiliki kesamaan satu sama lain dan juga kesamaan atau perbedaan dengan H1N1. Berdasarkan titik waktu diperoleh 3 tricluster tidak memberikan efek karena pola ekspresi gen tiap waktu sama dengan kondisi awal yaitu titik waktu ke-1 dan 17 tricluster diduga memberikan efek paska infeksi. Untuk menilai kualitas hasil tricluster terbentuk dalam penggambaran fungsi biologis dari kumpulan gen pada tricluster dilakukan evaluasi gene ontology (GO). GO adalah sebuah sistem untuk menggambarkan fungsi, biological process, celluler componet gen dan moleculer function dalam berbagai organisme. Dari hasil evaluasi diperoleh sebanyak 20 tricluster yang memiliki keterlibatan dan kaitan kuat dengan setiap konsep GO. Sebanyak 3 tricluster hanya memiliki keterlibatan atau kaitan pada salah satu aspek GO dan 1 tricluster yang memiliki keterlibatan pada semua aspek GO namun hanya pada aspek celuller componet yang memiliki kaitan kuat. Hal ini dapat menjadi acuan bagi peneliti bidang biologi untuk memfokuskan penelitian lebih lanjut dalam pemahaman fungsi biologis pada himpunan tricluster yang memiliki keterlibatan dan kaitan kuat.


Triclustering analysis is a technique capable of clustering three-dimensional data simultaneously, thus obtaining subspaces of the 3D data consisting of subsets of observations (genes), attribute subsets (conditions), and context subsets (time). The triclustering analysis conducted in this research utilizes the δ-Trimax method through a two-way K-means approach. The goal of the δ-Trimax method is to find triclusters that have minimum values of three-dimensional mean square residu MSR_3D and maximum volume. The two-way K-means approach is used to form an initial population to reduce computational burden and aid in forming better triclusters. This method will be implemented on gene expression data from HAE (Human Airway Epithelial) cultures infected with SARS-CoV, SARS-dORF6, SARS-BatSRBD, and H1N1 viruses. The implementation is carried out through 9 simulations, and the best simulation is obtained with a threshold value of δ calculated from MSR of 0.0435, a threshold value of λ=1.7, resulting in 24 formed triclusters based on the triclustering quality index (TQI) assessment. From the set of triclusters, information regarding the comparison of gene expression patterns between SARS-CoV, SARS-dORF6, SARS-BatSRBD viruses and H1N1 influenza virus is obtained. There are 7 triclusters that exhibit similar gene expression patterns across all conditions, and 8 triclusters that are suspected to have condition differences between various SARS-CoV viruses and the H1N1 virus. Other triclusters also provide information where only certain SARS-CoV variations share similarities with each other or similarities or differences with H1N1. Based on the time points, 3 triclusters show no effect as their gene expression patterns remain the same as the initial condition (time point 1), while 17 triclusters are suspected to have post- infection effects. To assess the quality of the formed triclusters in terms of biological function representation of the gene sets within the triclusters, an evaluation of gene ontology (GO) is performed. GO is a system for describing the functions, biological processes, cellular components, and molecular functions of genes across various organisms. The evaluation method involves the Database for Annotation, Visualization, and Integrated Discovery (DAVID) in calculating p-values. The evaluation results reveal that 20 triclusters have strong involvement and correlation with each GO concept. Three triclusters only exhibit involvement or correlation in one specific aspect of GO, and one tricluster exhibits involvement in all GO aspects, but with a strong correlation only in the cellular component aspect. This information can serve as a reference for researchers in the field of biology to focus further research on understanding the biological functions within tricluster sets that have strong involvement and correlation.

"
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Fabian Alkautsar
"Analisis triclustering adalah metode data mining yang memiliki tujuan untuk mengelompokkan data tiga dimensi. Metode ini kerap kali digunakan untuk bidang bioinformatika. Pada penelitian ini digunakan metode analisis triclustering delta trimax. Delta Trimax pada intinya adalah metode analisis triclustering yang bertujuan untuk menemukan tricluster yang memiliki nilai MSR yang lebih kecil dari nilai threshold (o) yang telah ditentukan. Penggunaan silhouette coefficient pada penelitian ini adalah untuk membantu menentukan nilai threshold (o) tersebut. Hasil triclustering delta trimax nantinya dievaluasi dengan menggunakan Triclustering Quality Index (TQI). Genetic algorithm (GA) adalah sebuah algoritma pencarian yang efisien yang didasari oleh evolusi biologis dan genetika alam. Algoritma GA digunakan untuk menemukan solusi terbaik. Terdapat tiga operator genetika yang digunakan di dalam GA, yaitu seleksi, crossover, dan mutasi. Pada penelitian ini, digunakan data ekspresi gen tiga dimensi dari sel kanker paru-paru fase stabil (A549) yang diberi perlakuan obat kemoterapi Motexafin Gadolinium (MGd) dan mannitol sebagai grup kontrol, dimana ekspresi gen diamati dalam 6 kondisi dan 3 titik waktu. Tujuan dari penelitian ini adalah untuk mengetahui apa kumpulan gen yang memiliki respon baik terhadap pemberian obat kemoterapi MGd dan kondisi apa yang mempengaruhinya. Pada penelitian ini, himpunan tricluster yang memiliki kualitas terbaik berdasarkan Triclustering Quality Index (TQI) adalah himpunan tricluster yang dihasilkan dengan nilai o = 0,004. Berdasarkan himpunan tricluster tersebut, didapatkan informasi penting mengenai kumpulan gen yang memiliki respon baik terhadap pemberian MGd tapi efek obat MGd tidak bertahan di setiap titik waktu. Terdapat juga gen yang menunjukkan respon baik pemberian obat kemoterapi MGd, tetapi efektivitasnya tidak terlalu maksimal karena responnya beririsan dengan subjek yang hanya diberikan mannitol. Setelah itu, dilihat bagaimana hubungan gen yang berasal dari keseluruhan dataset dengan penyakit melalui gene ontology sebagai informasi tambahan untuk perkembangan obat MGd. Nilai fold enrichment tertinggi pada GO biological process adalah Cytoplasmic Translation, pada GO Cellular Component adalah cytosolic ribosome, dan pada GO Molecular Function adalah structural constituent of ribosome.
......Triclustering analysis is a data mining method aimed at grouping three-dimensional data. This method is often used in the field of bioinformatics. In this study, the delta trimax triclustering analysis method is used. Delta Trimax essentially aims to find triclusters with Mean Squared Residue (MSR) values smaller than a predetermined threshold (o). The silhouette coefficient is used in this study to help determine the threshold (o). The results of the delta trimax triclustering are then evaluated using the Triclustering Quality Index (TQI). The genetic algorithm (GA) is an efficient search algorithm based on biological evolution and natural genetics. GA is used to find the best solution. There are three genetic operators used in GA: selection, crossover, and mutation. In this study, three-dimensional gene expression data from stable phase lung cancer cells (A549) treated with the chemotherapy drug Motexafin Gadolinium (MGd) and mannitol as a control group were used, where gene expression was observed under 6 conditions and 3 time points. The aim of this study is to identify which sets of genes respond well to MGd chemotherapy and which conditions influence these responses. The set of triclusters with the highest quality based on the Triclustering Quality Index (TQI) was obtained with o=0.004. From this set of triclusters, important information was obtained about the sets of genes that respond well to MGd, but the effect of MGd does not persist at every time point. There are also genes that show a good response to MGd chemotherapy, but its effectiveness is not maximized because the response overlaps with subjects that were only given mannitol. Subsequently, the relationship between genes from the entire dataset and the disease is observed through gene ontology as additional information for the development of MGd drugs. The highest fold enrichment value in the GO biological process is Cytoplasmic Translation, in the GO Cellular Component is cytosolic ribosome, and in the GO Molecular Function is structural constituent of ribosome."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library