Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 119673 dokumen yang sesuai dengan query
cover
Luthfi Zahiya
"

Triclustering merupakan metode unsupervised learning yang bekerja pada data tiga dimensi dengan dimensi-dimensi berupa observasi, atribut, dan konteks. Tujuan dari triclustering adalah untuk membentuk himpunan submatriks yang disebut sebagai tricluster berdasarkan ketiga dimensi pada data yang diberikan. Data tiga dimensi banyak ditemukan dalam bidang biomedis, di mana hal tersebut turut mendorong penggunaan dan pengembangan triclustering untuk keperluan analisis data ekspresi gen di mana salah satu alternatif dimensi-dimensinya adalah gen, sampel, dan waktu (gene, sample, time) dan biasa juga disebut sebagai data GST. Salah satu metode triclustering yang dikembangkan untuk menganalisis data tiga dimensi short time-series adalah Order Preserving Tricluster (OPTricluster). OPTricluster mempertahankan sifat natural dimensi waktu yang berurutan dan mengelompokkan data ke dalam tricluster berdasarkan pola. Penelitian ini mengimplementasikan metode OPTricluster pada data GST biopsi otot rangka pria sehat yang berpuasa selama 24 jam. Tricluster-tricluster yang terbentuk dievaluasi menggunakan nilai Multi Slope Measure (MSL) untuk mengetahui kualitas grafis tricluster. MSL dikembangkan untuk mengevaluasi tricluster berisi data GST dan nilai MSL yang rendah menandakan kualitas tricluster yang baik. Berdasarkan analisis data GST, ditemukan bahwa penggunaan δ=1,7 menghasilkan tricluster pola constant dan divergent terbaik dan penggunaan δ=1,5 menghasilkan tricluster pola conserved terbaik. Namun, tricluster yang terbentuk mengindikasikan bahwa puasa selama 24 jam tidak menyebabkan banyak perubahan nilai ekspresi gen pada otot rangka manusia.


Triclustering is a method of unsupervised learning that runs on three-dimensional data where the dimensions are observation, attribute, and context. The objective of triclustering is to create a set of triclusters based on the three dimensions within the provided data. The abundance of three-dimensional data in the biomedical field is a big factor on the utilization and improvement of triclustering, particularly in the analysis of gene expression data which in it are the dimensions gene, sample, and time or abbreviated as GST data. One of the triclustering method developed to analyze three-dimensional short time-series data is Order Preserving Tricluster (OPTricluster). OPTricluster preserves the natural sequiential properties of the time dimension and organizes data into triclusters based on patterns. This study applies the OPTricluster method on the GST data from muscle biopsies from fasting healthy men. The formed triclusters are evaluated graphically using the Multi Slope Measure (MSL). A small MSL score indicates a good tricluster. Based on the analysis of GST data, δ=1,7 produces the best constant and divergent triclusters and δ=1,5 produces the best conserved triclusters. However, the triclusters formed suggest that fasting for 24 hours doesn’t have a lot of effect on gene expressions in human muscle.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Silvia
"Teknologi microarray merupakan analisis terhadap tingkat ekspresi puluhan ribu gen secara paralel untuk melihat perbedaan ekspresi gen. Penelitian microarray menghasilkan suatu nilai yang dirangkum dalam sebuah data yang disebut sebagai data ekspresi gen. Data ekspresi gen umumnya memiliki ukuran yang besar dan penggunaannya luas. Akan tetapi, data ekspresi gen sering mengalami masalah missing values. Data ekspresi gen umumnya mengandung persentase missing values sebesar 10% atau bahkan hingga 90% gen memiliki satu hingga lebih missing values. Salah satu solusi untuk mengatasi adanya missing values adalah dengan menggunakan teknik imputasi.  Pada penelitian ini, diajukan metode imputasi missing values Chronological Biclustering dengan basis PCor-MSRE yang berdasarkan pada konsep biclustering. Penentuan anggota bicluster dengan kesamaan sifat co-expressed dan ukuran magnitude dilakukan berdasarkan pada skor Mean Squared Residue (MSR), jarak Euclidean, dan ukuran jarak korelasi Pearson antara masing-masing gen dengan gen yang mengandung missing values. Dilakukan perhitungan skor MSR, jarak Euclidean, dan ukuran jarak korelasi Pearson pada setiap gen, kemudian dipilih k gen yang memberikan skor terkecil untuk masing-masing kriteria. Selanjutnya, dibentuk bicluster yang digunakan untuk mengimputasi nilai observasi yang missing. Metode ini merupakan pengembangan dari metode SBi-MSREimpute yang cocok digunakan pada data ekspresi gen non-time series atau time series. Metode diimplementasikan pada data ekspresi gen lengkapnon-time series GSE142693 mengenai sel tumor 12 pasien Glioblastoma. Pada data GSE142693, dilakukan konstruksi missing values MCAR dengan missing rate sebesar 5%, 10%, 20%, 30%, 40%, 50%, dan 60%. Performa metode diukur dengan skor NRMSE dan korelasi Pearson, kemudian dibandingkan dengan metode SBi-MSREimpute. Berdasarkan pada skor korelasi Pearson, metode Chronological Biclustering dengan basis PCor-MSRE merupakan metode yang cukup baik dibanding SBi-MSREimpute dalam mengimputasi missing values pada data GSE142693 jika missing rate-nya cukup besar (40%, 50% dan 60%) dengan penggunaan nilai yaitu  dan. Untuk nilai k yang lebih kecil dari 25, metode Chronological Biclustering dengan basis PCor-MSRE cukup baik digunakan (dibanding SBi-MSREimpute) jika jumlah observasi yang missing sebanyak 50% dan 60%. Performa metode Chronological Biclustering dengan basis PCor-MSRE semakin baik seiring dengan membesarnya nilai k yang digunakan. Artinya, performa metode Chronological Biclustering dengan basis PCor-MSRE dapat dipengaruhi oleh penentuan nilai k di awal.

Microarray technology is an analysis of the expression levels of tens of thousands of genes in parallel to see differences in gene expression. Microarray research produces a value that is summarized in a data called gene expression data. Gene expression data are generally large in size and widely used. However, gene expression data often suffer from missing values problems. Gene expression data generally contain a percentage of missing values of 10% or even up to 90% of genes having one or more missing values. One solution to overcome the missing values is to use the imputation technique. In this research, the method of imputing missing values Chronological Biclustering is proposed on the PCor - MSRE basis which is based on the biclustering concept. Determination of bicluster members with similar co-expressed traits and magnitude measures was carried out based on the Mean Squared Residue (MSR) score, the Euclidean distance, and the measure of the Pearson correlation distance between each gene and the gene containing missing values. The MSR score, Euclidean distance, and Pearson correlation distance measures were calculated for each gene, then k genes were selected that gave the smallest score for each criterion. Next, a bicluster is formed which is used to impute the missing observation values. This method is a development of the SBi-MSRE impute method which is suitable for use in non-time series or time series gene expression data. The method was implemented on the complete non-time series gene expression data GSE142693 regarding tumor cells of 12 Glioblastoma patients. In the GSE142693 data, MCAR missing values were constructed with a missing rate of 5%, 10%, 20%, 30%, 40%, 50%, and 60%. The performance of the method was measured by the NRMSE score and Pearson correlation, then compared with the SBi-MSREimpute method. Based on the Pearson correlation score, the Chronological Biclustering method with PCor - MSRE basis is a method that is quite good compared to SBi-MSRE impute in imputing missing values in GSE142693 data if the missing rate is large enough (40%, 50% and 60%) with the use of namely k=25,k=45,k=65,k=105,k=335, and k=375. For k values less than 25, the Chronological Biclustering method on the basis of PCor - MSRE is quite good to use (compared to SBi-MSRE impute) if the number of missing observations are 50% and 60%. The performance of the Chronological Biclustering method on the PCor - MSRE basis is getting better as the value of k used increases. This means that the performance of the Chronological Biclustering method on the PCor-MSRE basis can be affected by determining the initial k value."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sanjung Maharani
"Triclustering merupakan salah satu teknik data mining pada data tiga dimensi untuk mengelompokkan data secara bersamaan pada baris dan kolom di titik waktu yang berbeda menjadi tricluster. Metode ini umumnya diterapkan pada bidang bioinformatika, khususnya data ekspresi gen tiga dimensi. Salah satu triclustering dengan pendekatan biclustering-based adalah THD-Tricluster. Langkah utama dari algoritma ini ialah generate bicluster dan genereate tricluster. Algoritma THD-Tricluster menggunakan pola pergeseran dan penskalaan dengan nilai Shifting-and-Scaling-Similarity (SSSim) untuk mengelompokkan gen dan menghasilkan tricluster. Hasil dari THD-Tricluster dievaluasi dengan Multi Slope Measure (MSL) yaitu sebuah pengukuran kualitas melalui representasi grafik dari tricluster. Dalam penelitian ini, data yang digunakan adalah data respon tiga sel individu terhadap pemberian sitokin berupa interleukin-1-beta pada sel mesenkim amnion manusia atau sel pada membran janin. Sitokin memicu regulasi gen inflamasi yang berkontribusi pada kelahiran prematur. Metode THD-Tricluster diimplementasikan pada 15 skenario dengan nilai threshold berbeda. Skenario yang optimal dipilih menggunakan nilai validasi coverage. Pada skenario optimal, diperoleh delapan tricluster yang kemudian dievaluasi menggunakan Multi Slope Measure (MSL). Tricluster 2 yang memiliki nilai MSL paling kecil dan dipilih sebagai tricluster optimal terdiri atas kumpulan gen dari sel yang responsif terhadap pemberian sitokin berupa interleukin-1-beta. Gen-gen pada Tricluster 2 inilah yang dapat digunakan sebagai bahan pertimbangan bagi para peneliti di bidang biologis dan medis untuk untuk penelitian lebih lanjut terkait kelahiran prematur.

Triclustering is one of the data mining techniques on three-dimensional data to cluster data simultaneously in rows and columns at different time points into triclusters. This method is generally applied to the field of bioinformatics, especially three-dimensional gene expression data. One of the triclustering methods with a biclustering-based approach is THD-Tricluster. The main steps of this algorithm are generate bicluster and generate tricluster. THD-Tricluster algorithm uses shifting and scaling patterns with Shifting-and-Scaling-Similarity (SSSim) values to cluster genes and generate tricluster. The result of THD-Tricluster is evaluated by Multi Slope Measure (MSL), a measurement of tricluster quality through graphical representation. In this study, the data used is the response data of three individual cells to cytokine in the form of interleukin-1-beta in human amniotic mesenchymal cells or cells in the fetal membrane. Cytokines stimulate the regulation of inflammatory genes that contribute to preterm birth. The THD-Tricluster method was implemented on 15 scenarios with different threshold values. The optimal scenario was selected using the coverage validation value. In the optimal scenario, eight triclusters were obtained which were then evaluated using Multi Slope Measure (MSL). Tricluster 2 which has the smallest MSL value and selected as the optimal consists of a collection of genes from cells that are responsive to cytokine administration in the form of interleukin-1-beta. The genes in Tricluster 2 can be used by biological and medical researchers to develop treatments to prevent premature birth."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fahrezal Zubedi
"Pada penelitian ini mengimplementasikan algoritma Similarity Based Biclustering dengan menggunakan PAM clustering pada tiga dataset ekspresi gen microarray. Penelitian ini bertujuan untuk mengetahui ekspresi regulasi dari masing-masing bicluster yang diperoleh dan mengetahui kinerja algoritma Similarity Based Biclustering-PAM clustering berdasarkan hasil analisis kelompok kondisi. Similarity based biclustering-PAM clustering secara teoritis terdiri dari empat tahap utama yaitu: mentransformasi data, membangun matriks similaritas, proses clustering khususnya dalam tesis ini menggunakan metode partisi PAM dan mengekstrak bicluster. Algoritma similarity based biclustering-PAM clustering dapat mengetahui ekspresi regulasi dari tiap bicluster pada tiga dataset yaitu: Diabetes Melitus tipe II, Diabetes Retinopati, dan Limfoma. Akurasi yang diperoleh dari algoritma Similarity Based Biclustering untuk masing-masing dataset yaitu Diabetes Melitus tipe II sebesar 0.55, Diabetes Retinopati sebesar 0.80 dan Limfoma sebesar 0.83.

In this research implements Similarity Based Biclustering algorithm by using PAM Clustering method in three dataset of microarray gene expression. Aim of this research is to know the regulated expression of each obtained bicluster and to know the performance of Similarity Based Biclustering PAM Clustering algorithm based on the result of group condition analysis. Similarity Based Biclustering is theoretically composed of four main stages transforming data, constructing matrix similarity, clustering process, especially in this thesis using PAM partition algorithm and extracting bicluster. Similarity Based Biclustering PAM is able to know the regulatory expression of each bicluster in three datasets Diabetes Mellitus type 2, Diabetes Retinopathy, and Lymphoma. Accuracy obtained from Similarity Based Biclustering algorithm for each dataset is 0.55 in data of type 2 diabetes mellitus, 0.80 in diabetic retinopathy data and 0.83 in lymphoma data.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49505
UI - Tesis Membership  Universitas Indonesia Library
cover
Sofia Debi Puspa
"Penelitian ini bertujuan untuk mengimplementasikan similarity based biclustering SBB dalam memperoleh bicluster sekumpulan gen dengan ekspresi yang similar di bawah kondisi tertentu yang signifikan pada data microarray. Secara teoritis similarity based biclustering terdiri atas tiga tahap utama, yaitu: membangun matriks similaritas baris gen dan matriks similaritas kolom kondisi , mempartisi masing-masing matriks similaritas dengan hard clustering khususnya dalam penelitian ini menggunakan partisi k-means, dan ekstrak bicluster. Sebelum mengimplementasikan metode SBB, strategi seleksi gen diterapkan dan selanjutnya dilakukan normalisasi. Perolehan evaluasi indeks silhouette pada dataset diabetic nephropathy, diabetic retinopathy dan lymphoma berturut-turut pada cluster kondisi yaitu 0,8304; 0,7853 dan 0,7382, sedangkan indeks silhouette untuk cluster gen yaitu 0,5382; 0,5408 dan 0,5464. Dan dari hasil analisis cluster kondisi, akurasi dari dataset diabetic nephropathy dan diabetic retinopathy yaitu 100 , sedangkan dataset lymphoma yaitu 98 . Selanjutnya dapat diketahui regulasi proses seluler yang terjadi pada bicluster dari ketiga dataset. Hasil analisis menunjukkan bahwa gen-gen yang diperoleh dari bicluster sesuai dengan fungsi gen dan proses biologis didukung oleh GO enrichment sehingga menjadi potensi yang besar bagi praktisi medis dalam tindak lanjut suatu penyakit yang diderita oleh pasien.

This study aims to implement similarity based biclustering SBB in obtaining a bicluster a set of genes that exhibit similar levels of gene expression under certain conditions that is significant in microarray data. Theoretically, similarity based biclustering consists of three main phase constructing the row gene similarity matrix and the column condition similarity matrix, partitioning each matrix similarity with hard clustering especially in this research using k means partition, and extracting bicluster. Before implementing the SBB method, the gene selection strategy is applied and subsequently normalized. The acquisition of silhouette index evaluation in diabetic nephropathy, diabetic retinopathy, and lymphoma on cluster condition respectively is 0.8304, 0.7853 and 0.7382, while the silhouette index for the gene cluster is 0.5382, 0.5408 and 0.5464. In addition, according to the cluster condition analysis, accuracy of dataset diabetic nephropathy and diabetic retinopathy is 100 , whereas dataset lymphoma is 98 . Furthermore, it can be known cellular regulation that occurs on the bicluster of the three datasets. The results of the analysis show that the genes obtained from bicluster are relevant to the function of genes and biological processes supported by GO enrichment , therefore it becomes a great potential for medical practitioners in the follow up of a disease suffered by the patient.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49530
UI - Tesis Membership  Universitas Indonesia Library
cover
Soeganda Formalidin
"Penelitian ini bertujuan untuk mencari korelasi yang kuat antar gen dan kondisi dari data ekspresi gen penyakit Diabetes Melitus (DM) pada sampel obesitas dan sampel kurus dengan menggunakan metode three phase biclustering. Tahap pertama pada metode ini adalah dengan menggunakan matriks dekomposisi Singular Value Decomposition (SVD) yang mentransformasikan data menjadi dua matriks berbasis gen dan kondisi. Selanjutnya pada tahap kedua menggunakan metode partisi Partition Around Medoids (PAM) pada dua matriks gen dan kondisi menggunakan jarak Euclidean sehingga jika digabung akan membentuk bicluster yang pada tahap tiga akan dievaluasi dengan menggunakan modifikasi lift algorithm berbasiskan korelasi Pearson yang cocok untuk mendeteksi bicluster model additive-multiplicative. Hasil dari implementasi algoritma yang digunakan pada dataset microarray dinamakan δ-corbicluster yang memiliki korelasi yang tinggi antar gen dan sampel. Implementasi dari tahap pertama dan kedua (SVDPAM) pada dataset DM dengan 1331 gen terseleksi menghasilkan 8 bicluster. Sedangkan hasil tahap ketiga yaitu modifikasi algoritma lift pada kedelapan bicluster ini menghasilkan 3 δ-corbicluster dengan masing-masing nilai korelasi yang tinggi yaitu 0,097, 0,095, 0,085, sehingga metode yang diusulkan dan hasil analisisnya pada gen dan sampel penyakit DM memiliki potensi besar ke depannya dalam penelitan pada bidang medis.

The purpose of this research is to find strong correlation among genes and conditions of Diabetes Melitus genes expression data which samples are obese and lean people using three phase biclustering. First step is to use matrix decomposition Singular Value Decomposition (SVD) to decompose matrix gene expression data into two global based gene and condition matrices. Second step is to use partition method Partition Around Medoid (PAM) to cluster gene and condition based matrices using Euclidean distance, forming several biclusters which further evaluated using modified lift algorithm based on Pearson correlation which is very appropriate method to detect additive-multiplicative bicluster type. The resulting bicluster of the proposed algorithm having strong correlation among genes and samples to microarray dataset are called δ-corbicluster. Implementation of the first and second step (SVD-PAM) to dataset DM with 1331 selected genes produces 8 biclusters. For the third step using modified lift algorithm to these 8 biclusters produces 3 δ-corbiclusters having strong correlation values: 0,097, 0,0095, 0,085, so that the proposed method and the result of analysis to genes and samples of DM have high potential in future medical researches.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49441
UI - Tesis Membership  Universitas Indonesia Library
cover
Nurul Hanifah
"Diagnosis kanker payudara umum menggunakan data morfologi dan infomasi klinis. Akan tetapi diagnosis kanker yang akurat dibutuhkan untuk menangani dan terapi yang tepat. Deteksi ekspresi gen merupakan cara yang dapat digunakan untuk menganalisis kanker hingga tingkat molekuler. Microarray adalah teknologi yang memungkinkan analisis ribuan ekspresi gen dalam waktu yang bersamaan. Pembelajaran mesin dapat digunakan untuk menganalisis pola pada microarray dataset. Model pembelajan dengan deep learning, seperti deep stacking network DSN diperlukan untuk data yang kompleks seperti pada microarray. DSN pertama kali diusulkan untuk mengatasi kekurangan dari deep learning pada umumnya. Selain itu dikarenakan tingginya dimensi data microarray, sebelum melalui proses pembelajaran diperlukan reduksi dimensi pada data microarray. Reduksi data menggunakan gene shaving, dimana data akan dikelompokan menjadi beberapa cluster dan juga dengan PCA. Selanjutnya data yang sudah direduksi melalui proses pembelajaran pada model DSN yang terdiri dari 2-layer, 3-layer dan 4-layer dengan laju pembelajaran 0.01, 0.1 dan 1.0. Parameter yang diukur adalah nilai akurasi, mean square error MSE dan waktu eksekusi, dimana nilai terbaik didapatkan pada DSN 2-layer dengan laju pembelajaran 1.0 pada data hasil reduksi PCA.

The diagnosis of breast cancer uses morphological data and clinical information. However, an accurate cancer diagnosis is necessary for the proper treatment. Gene expression detection is a way that can be used to analyze cancer to the molecular level. Microarray is a technology that allows the analysis of thousands of gene expression at the same time. Machine learning can be used to analyze patterns in the microarray dataset. Machine learning with deep architecture deep learning, such as deep stacking learning DSN, is needed for complex data such as microarray. DSN was proposed to overcome the shortage of deep learning. In addition, due to the high dimension of microarray data, dimension reduction in microarray data is required before going through the learning process. Data reduction uses gene shaving, where data will be grouped into clusters and also PCA. Clusters found through the process of gene shaving is a cluster that carries important genetic information in cancer cells so that the gene can represent all data. Furthermore, the data has been reduced going through the learning process on the DSN model consisting of 2 layer, 3 layer and 4 layer with the learning rate of 0.01, 0.1 and 1.0. The parameters measured are the accuracy, mean square error MSE and execution time, which the best value is obtained on 2 layer DSN with learning rate 1.0 on data from the reduction of PCA."
Depok: Fakultas Teknik Universitas Indonesia, 2018
T50170
UI - Tesis Membership  Universitas Indonesia Library
cover
Syahputri Riani
"

Salah satu teknik analisis yang dapat digunakan pada data mining dalam mengelompokkan data adalah Triclustering. Triclustering merupakan metode pengelompokan secara bersamaan pada data tiga dimensi yang terdiri dari observasi, atribut, dan konteks. Triclustering kerap digunakan pada bidang bioinformatika untuk mengelompokkan data ekspresi gen di titik waktu tertentu pada suatu kondisi eksperimen. Triclustering yang diajukan pada penelitian ini menggunakan metode Hybrid  – TRIMAX Binary Particle Swarm Optimization. Particle Swarm Optimization (PSO) adalah teknik pengelompokan yang terinspirasi oleh perilaku biologis populasi ikan atau kawanan burung yang bergerak untuk menuju sumber makanan. Setiap individu di dalam populasi disebut sebagai partikel yang didefinisikan sebagai kandidat solusi (tricluster). Istilah “Binary” mengartikan bahwa partikel yang bergerak di ruang pencarian berbentuk vektor biner (bit) yang bernilai 0 atau 1. Tahap inisiasi populasi dilakukan dengan menggunakan algoritma nodes deletion pada  – TRIMAX untuk menghasilkan populasi awal yang homogen.  Metode  – TRIMAX dapat menghasilkan tricluster dengan nilai Mean Residual Square (MSR) lebih kecil dari threshold 𝛿 sehingga dapat meningkatkan efektifitas komputasi dari metode Hybrid  – TRIMAX Binary Particle Swarm Optimization. Algoritma gabungan kemudian diimplementasikan pada data ekspresi gen tiga dimensi sel kanker pankreas PANC-1 yang diberikan obat kemoterapi ATO, JQ1, dan kombinasi keduanya pada 3 titik waktu. Diperoleh tricluster optimum dengan skenario  0,0003;  0,8;   0,2; dan tipe neighbourhood = “Gbest”. Tricluster tersebut memiliki nilai TQI sebesar 1,427E-09 dan volume tricluster sebesar 169.410. Berdasarkan tricluster optimum, diperoleh informasi mengenai kumpulan gen yang tidak merespon baik terhadap pengobatan JQ1 dan JQ1+ATO pada jangka waktu menengah dan panjang. Hasil analisis ontologi gen menunjukkan tiga aspek ontologi yang signifikan dengan p-value < 0,05, yaitu proses biologi, fungsi molekuler, dan komponen seluler. Diperoleh gen yang resisten terhadap pengobatan terlibat dalam proses biologi metabolisme sel dan pengembangan sel yang mempertahankan kehidupan sel. Pada aspek fungsi molekuler, gen berperan dalam proses pengikatan, seperti pengikatan ion, senyawa organik siklik, dan senyawa heterosiklik, serta aktivitas katalitik. Selain itu, juga ditemukan bahwa sebagian besar gen berlokasi pada sitoplasma, organel, dan nukleus dalam komponen seluler. Aspek-aspek dari ontologi gen dapat berkontribusi pada resistensi kumpulan gen dalam sel kanker PANC-1 terhadap pengobatan.


One of the analysis techniques that can be used in data mining to group data is Triclustering. Triclustering is a method of simultaneously grouping three-dimensional data consisting of observations, attributes, and context. Triclustering analysis is often used in the field of bioinformatics to group gene expression data at certain time points under experimental conditions. The triclustering analysis proposed in this study used the Hybrid  – TRIMAX Binary Particle Swarm Optimization method. Particle Swarm Optimization (PSO) is a clustering technique inspired by the biological behavior of fish populations or flocks of birds that move towards food sources. Each individual in the population is referred as particles which are defined as candidate solutions (tricluster). The term "Binary" means that the particles move in the search space in the form of binary vectors (bits) with a value of 0 or 1, the number "1" represents that an individual is present in the particle. The population initialization stage is carried out using the nodes deletion algorithm in δ-TRIMAX to produce a homogeneous initial population.  The δ-TRIMAX method can generate a tricluster with a Mean Residual Square (MSR) value smaller than the threshold 𝛿 so that it can increase the computational effectiveness of the Hybrid δ-TRIMAX Binary Particle Swarm Optimization method. The combined algorithm then implemented on three-dimensional gene expression data of PANC-1 pancreatic cancer cells given ATO, JQ1, and a combination of both chemotherapy drugs at three time points. The optimum tricluster was obtained with scenario  0,0003;  0,8;   0,2; and neighborhood type = "Gbest". The tricluster has a TQI value of 1.427E-09 and a tricluster volume of 169,410. Based on the optimum tricluster, information was obtained about the gene pools that did not respond well to JQ1 and JQ1+ATO treatment in the medium and long term. The results of gene ontology analysis showed three significant ontological aspects with p-value <0.05, namely biological processes, molecular functions, and cellular components. It was found that treatment-resistant genes are involved in the biological process of cell metabolism and cell development that maintains cell life. In the aspect of molecular function, genes play a role in binding processes, such as ion binding, cyclic organic compounds, and heterocyclic compounds, as well as catalytic activity. In addition, it was also found that most genes are located in the cytoplasm, organelles, and nucleus in cellular components. These aspects of the gene ontology may contribute to the resistance of the gene pool in PANC-1 cancer cells to treatment.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hafsa Khaerunisa Wenno
"Data mining merupakan teknik pengolahan data yang dapat digunakan untuk menemukan pola-pola kelompok dan informasi yang berguna dari kumpulan data tersebut. Salah satu teknik data mining adalah metode triclustering. Triclustering bekerja pada data tiga dimensi. Umumnya algoritma tricluster tidak efektif dalam menganalisis titik waktu pegamatan yang berjumlah sedikit. Oleh karena itu, dikembangkanlah algoritma triclustering berbasis pola yang dirancang untuk menganalisis data microarray dengan jumlah titik waktu pengamatan sedikit yaitu Order Preserving Tricluster (OPTricluster). OPTricluster membentuk tricluster dengan mengidentifikasi gen-gen yang memiliki perubahan tingkat ekspresi yang sama pada subset kondisi eksperimen disepanjang titik waktu. Setelah tricluster didapatkan, analisis Gene Ontology dibutuhkan untuk mendapatkan pemahaman anotasi gen pada hasil tricluster. Metode OPTricluster diimplementasikan pada data microarray sel kanker pankreas ASPC-1 dengan beberapa skenario menggunakan threshold yang berbeda. Skenario terbaik ditunjukkan oleh threshold optimum yang diperoleh dengan membandingkan rata-rata skor Coverage Tricluster dan Tricluster Quality Index. Kemudian tricluster dari skenario terbaik dianalisis dengan Gene Ontology (GO). Hasil penelitian ini menunjukkan bahwa metode OPTricluster berhasil membentuk tricluster dengan kinerja yang baik pada 3 pola tricluster yaitu tricluster pola constant, conserved, dan divergent. Selanjutnya analisis GO dilakukan pada tricluster terbaik pola conserved yaitu tricluster pada kelompok gen yang memiliki pola perubahan tingkat ekspresi gen yang sama saat diberikan obat JQ1 dan diperoleh informasi bahwa respon dari gen-gen sel kanker pankreas ASPC-1 dominan terlibat dalam proses metabolisme, dimana gen-gen tersebut berperan dalam perubahan tingkat ekspresi gen, selain itu letak gen-gen tersebut pun berada dalam inti sel.

Data mining is data processing techniques that can be used to find group patterns and useful information from the data set. One of the data mining techniques is the triclustering method. Triclustering works on three-dimensional data. Generally, tricluster algorithms are not effective in analyzing a small number of observation time points. Therefore, a pattern-based triclustering algorithm designed to analyze microarray data with a small number of observation time points was developed under the name Order Preserving Tricluster (OPTricluster). OPTricluster forms triclusters by identifying genes that have similar expression level changes in a subset of experimental conditions across time points. Once the tricluster is obtained, analysis with Gene Ontology is required to gain an understanding of gene annotation in the tricluster result. OPTricluster method was implemented on ASPC-1 pancreatic cancer cell microarray data with several scenarios using different thresholds. The best scenario is indicated by the optimum threshold obtained by comparing the average Tricluster Coverage and Tricluster Quality Index scores. Then the tricluster of the best scenario is analyzed with Gene Ontology (GO). The results showed that the OPTricluster method successfully formed tricluster with good performance in 3 tricluster patterns, namely constant, conserved, and divergent tricluster patterns. Furthermore, GO analysis was carried out on the best tricluster conserved pattern, namely tricluster in the gene group that has the same pattern of changes in gene expression levels when given the drug JQ1 and obtained information that the response of ASPC-1 pancreatic cancer cell genes is dominantly involved in metabolic processes, where these genes play a role in changes in gene expression levels, besides that the location of these genes is also in the cell nucleus."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Oon Septa
"Tantangan komputasi dibutuhkan pada analisis data microarray dikarenakan karakteristik data tersebut yang memiliki ukuran yang sangat besar dan memiliki ekspresi gen yang bervariasi di setiap kondisi, seperti contohnya data microarray Human Immunodeficiency Virus-1. Penelitian sebelumnya telah menggunakan ukuran Multi Slope Measure pada algoritma Triclustering Genetic Based tetapi algoritma tersebut belum tersedia secara luas dan belum dapat digunakan semua orang. Penelitian ini bertujuan untuk membangun program Multi Slope Measure pada algoritma Triclustering Genetic Based menggunakan perangkat lunak R berbasis open source pada data microarray ekspresi gen Human Immunodeficiency Virus-1. Pada simulasi program yang dibangun digunakan pada data microarray ekspresi gen untuk melihat kesuksesan program yang telah dibangun. Teknik triclustering diperlukan untuk mengelompokkan data 3 Dimensi berdasarkan data yang memiliki kesamaan pola. Algoritma Triclustering Genetic Based merupakan algoritma yang berdasarkan teori evolusi yang dapat mengelompokkan data dengan ukuran kualitas yang  maksimum. Penelitian ini menargetkan mencari 10 tricluster dan berhasil didapatkan semua 10 tricluster nya. Dari 10 tricluster tersebut didapatkan 6 gen yang berkaitan dengan Human Immunodeficiency Virus-1 yaitu HLA-C, JUN, CCR5, ELF1, CX3CR1, dan GATA-3.

Computational challenges are needed in microarray data analysis because the characteristics of the data are very large and have gene expressions that vary in each condition, such as the microarray data for Human Immunodeficiency Virus-1 disease. Previous research used the Multi Slope Measure on the Genetic Based Triclustering algorithm, but the algorithm is not yet globally available and cannot be used by everyone. This study aims to build a Multi Slope Measure program on the Triclustering Genetic Based algorithm using open source-based R software on the microarray data of Human Immunodeficiency Virus-1 disease gene expression. In the simulation of the program that has been built, the program is tested on gene expression microarray data to see its success. The triclustering technique is needed to group 3-dimensional data based on data that has the same pattern. Genetic Based Triclustering Algorithm is an algorithm based on the theory of evolution that can classify data with maximum quality measure. This study aimed to find 10 triclusters and has successfully obtained all 10 triclusters. From the 10 triclusters, 6 genes were found related to Human Immunodeficiency Virus-1, namely HLA-C, JUN, CCR5, ELF1, CX3CR1, and GATA-3."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>