Hasil Pencarian

Ditemukan 166403 dokumen yang sesuai dengan query

Awlia Dwi Rachma

Metode THD-Tricluster dan implementasinya pada data ekspresi gen tiga dimensi = THD-Tricluster method and its implemenntation on three-dimensional gene expression data

Metode THD-Tricluster merupakan analisis triclustering dengan pendekatan berbasis biclustering. Pada metode THD-Tricluster digunakan nilai Shifting-and-Scaling Similarity untuk membentuk bicluster terlebih dahulu dan dilanjutkan dengan membentuk tricluster. Nilai SSSim menggunakan Shifting-and-Scaling Correlation untuk mendeteksi adanya korelasi antaranggota dengan pola pergeseran dan penskalaan serta koherensi antarwaktu dan membandingkannya dengan nilai threshold. Metode THD-Tricluster dilakukan pada data respon pengobatan terapi interferon-beta pada pasien sklerosis ganda. Skenario optimal adalah skenario dengan nilai coverage terkecil yaitu saat menggunakan nilai threshold tertinggi. Pada skenario tersebut diperoleh dua jenis tricluster yaitu tricluster yang memiliki kumpulan gen pada pasien yang responsif dan pasien yang tidak responsif terhadap terapi. Perbedaan kumpulan gen pada kedua tricluster dapat digunakan oleh para ahli medis untuk mengembangkan pengobatan terapi untuk meningkatkan tingkat keresponsifan pasien sklerosis ganda terhadap terapi tersebut.

The THD-Tricluster method is a triclustering analysis with a biclustering-based approach. The THD-Tricluster method uses the Shifting-and-Scaling Similarity value to form a bicluster first and shows it by forming a tricluster. The SSSim value uses Shifting-and-Scaling Correlation to use an interface with shifting and scaling patterns as well as intertemporal coherence and compares it with the threshold value. The THD-Tricluster method was performed on treatment response data to interferon-beta therapy in multiple sclerosis patients. The optimal scenario is a scenario with a coverage value scenario that uses the highest threshold value. In this scenario, there are two types of tricluster, namely the tricluster which has a collection of genes in responsive patients and patients who are not responsive to therapy. Differences in gene pools in the two tricluster can be used by medical professionals to develop IFN-Î² therapeutic treatments to increase the responsiveness of multiple sclerosis patients to these therapies.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Sanjung Maharani

Evaluasi THD-Tricluster Menggunakan Multi Slope Measure (MSL) pada Data Ekspresi Gen Tiga Dimensi dari Respon Sel Mesenkim Amnion = THD-Tricluster Evaluation Using Multi Slope Measure (MSL) on Three-Dimensional Gene Expression Data of Amniotic Mesenchymal Cell Responses

"Triclustering merupakan salah satu teknik data mining pada data tiga dimensi untuk mengelompokkan data secara bersamaan pada baris dan kolom di titik waktu yang berbeda menjadi tricluster. Metode ini umumnya diterapkan pada bidang bioinformatika, khususnya data ekspresi gen tiga dimensi. Salah satu triclustering dengan pendekatan biclustering-based adalah THD-Tricluster. Langkah utama dari algoritma ini ialah generate bicluster dan genereate tricluster. Algoritma THD-Tricluster menggunakan pola pergeseran dan penskalaan dengan nilai Shifting-and-Scaling-Similarity (SSSim) untuk mengelompokkan gen dan menghasilkan tricluster. Hasil dari THD-Tricluster dievaluasi dengan Multi Slope Measure (MSL) yaitu sebuah pengukuran kualitas melalui representasi grafik dari tricluster. Dalam penelitian ini, data yang digunakan adalah data respon tiga sel individu terhadap pemberian sitokin berupa interleukin-1-beta pada sel mesenkim amnion manusia atau sel pada membran janin. Sitokin memicu regulasi gen inflamasi yang berkontribusi pada kelahiran prematur. Metode THD-Tricluster diimplementasikan pada 15 skenario dengan nilai threshold berbeda. Skenario yang optimal dipilih menggunakan nilai validasi coverage. Pada skenario optimal, diperoleh delapan tricluster yang kemudian dievaluasi menggunakan Multi Slope Measure (MSL). Tricluster 2 yang memiliki nilai MSL paling kecil dan dipilih sebagai tricluster optimal terdiri atas kumpulan gen dari sel yang responsif terhadap pemberian sitokin berupa interleukin-1-beta. Gen-gen pada Tricluster 2 inilah yang dapat digunakan sebagai bahan pertimbangan bagi para peneliti di bidang biologis dan medis untuk untuk penelitian lebih lanjut terkait kelahiran prematur.

Triclustering is one of the data mining techniques on three-dimensional data to cluster data simultaneously in rows and columns at different time points into triclusters. This method is generally applied to the field of bioinformatics, especially three-dimensional gene expression data. One of the triclustering methods with a biclustering-based approach is THD-Tricluster. The main steps of this algorithm are generate bicluster and generate tricluster. THD-Tricluster algorithm uses shifting and scaling patterns with Shifting-and-Scaling-Similarity (SSSim) values to cluster genes and generate tricluster. The result of THD-Tricluster is evaluated by Multi Slope Measure (MSL), a measurement of tricluster quality through graphical representation. In this study, the data used is the response data of three individual cells to cytokine in the form of interleukin-1-beta in human amniotic mesenchymal cells or cells in the fetal membrane. Cytokines stimulate the regulation of inflammatory genes that contribute to preterm birth. The THD-Tricluster method was implemented on 15 scenarios with different threshold values. The optimal scenario was selected using the coverage validation value. In the optimal scenario, eight triclusters were obtained which were then evaluated using Multi Slope Measure (MSL). Tricluster 2 which has the smallest MSL value and selected as the optimal consists of a collection of genes from cells that are responsive to cytokine administration in the form of interleukin-1-beta. The genes in Tricluster 2 can be used by biological and medical researchers to develop treatments to prevent premature birth."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Elke Annisa Octaria

Metode THD-Tricluster dengan New Residue Score pada Data Ekspresi Gen Human Immunodeficiency Virus-1 = THD-Tricluster Method with New Residue Score at Human Immunodeficiency Virus-1 Gene Expression Data

Triclustering merupakan teknik analisis pada data 3D yang bertujuan untuk mengelompokkan data secara bersamaan pada baris dan kolom di sepanjang waktu/kondisi yang berbeda. Hasil dari teknik ini disebut dengan tricluster. Tricluster merupakan subruang berupa subset dari baris, kolom, dan waktu/kondisi. Triclustering biasanya digunakan untuk menganalisis data ekspresi gen. Studi dan analisis data ekspresi gen selama perkembangan suatu penyakit merupakan masalah penelitian yang penting dalam bioinformatika dan aspek klinis. Oleh karena itu, penelitian ini mengimplementasikan metode THD-Tricluster dengan new residue score pada data ekspresi gen perkembangan penyakit HIV-1 yang terdiri dari 22283 probe id, 40 observasi, dan 4 kondisi. Pada tahap pertama dilakukan pencarian bicluster dengan lift algorithm berdasarkan nilai new residue score dengan threshold . Pada tahap kedua dilakukan pencarian tricluster dengan menentukan minimum probe dan minimum observasi Â sehingga memperoleh 33 tricluster. Hasil evaluasi tricluster menggunakan Inter-temporal Homogeneity dengan threshold Â diperoleh 32 tricluster yang menunjukkan 3 gen yang terkait dengan HIV-1 yaitu HLA-C, ELF-1, dan JUN.

Triclustering is an analysis technique on 3D data that aims to group data simultaneously on rows and columns across different times/conditions. The result of this technique is called a tricluster. Triclusters are a subspace consisting of a subset of rows, columns, and time/conditions. Triclustering is commonly used to analyze gene expression data. The study and analysis of gene expression data during disease progression is an important issue in the research of bioinformatics and clinical aspects. Therefore, this study implements the THD-Tricluster method with a new residue score on the gene expression data for HIV-1 disease progression consisting of 22283 probe id, 40 observations, and 4 conditions. In the first stage, a bicluster search was carried out with a lift algorithm based on the new residue score with a threshold of I = 0.08. In the second stage, the tricluster search was carried out by determining the minimum probe = 5 and the minimum observation = 2 to obtain 33 triclusters. The results of the tricluster evaluations using Inter-temporal Homogeneity with a threshold of Ã? = 0.8 obtained 32 triclusters which shows 3 genes related to HIV-1, namely HLA-C, ELF-1, and JUN.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Siregar, Anggrainy Togi Marito

Membangun THD-Tricluster Berbasis Biclustering dengan Menggunakan Transposed Virtual Error pada Data Ekspresi Gen = Building Biclustering Based THD-Tricluster Using Transposed Virtual Error in Gene Expression Data

"Data tiga dimensi banyak ditemukan terutama dalam bidang biomedical dan sosial. Contoh data tiga dimensi adalah data gen-sampel-waktu, individual-fitur-waktu, atau node-node-time,yang umumnya disebut sebagai data konteks-atribut-observasi. Salah satu teknik dalam mengelola data tiga dimensi yaitu triclustering. Penelitian ini menggunakan metode THD-Tricluster untuk mendapatkan hasil triclustering pada data 3 dimensi penyakit AIDS yang disebabkan oleh virus Human Immunodeficiency Virus Tipe 1 (HIV-1). Pencarian triclustering tersebut dilakukan melalui tahap biclustering yang dilakukan pada setiap kondisi. Penelitian ini dengan memodifikasi algoritma Cheng & Church (CC) untuk menghasilkan biclustering dengan ukuran yang digunakan yaitu transposed virtual error ) yang mampu mengelompokkan data berdasarkan pola pergeseran (shifting) dan penskalaan (scaling). Hasil bicluster tersebut yang kemudian diiriskan pada masing-masing kondisi sehingga menghasilkan triclustering. Keseluruhan penelitian ini dilakukan pada program RStudio. Setiap tricluster memiliki suatu kedalaman yang dapat ditentukan bergantung pada banyak kondisi yang diiriskan. Implementasi ukuran transposed virtual error pada triclustering ini menghasilkan 4 tricluster pada kedalaman empat. Evaluasi tricluster tersebut dilakukan dengan menggunakan inter temporal homogeneity dan diperoleh nilai korelasi tricluster antar kondisi di atas 0.9. Dari hasil triclustering tersebut dianalisis probe id gen yang berpengaruh pada penyakit AIDS. Dari analisis tersebut ditemukan 2 simbol gen yang berhubungan dengan penyakit AIDS yang disebabkan oleh HIV-1 yang ada pada setiap kondisi penderita HIV-1 normal, akut, kronis, dan nonprogressor yaitu HLA-C dan ELF-1.

Three-dimensional data are mainly found in biomedical and social fields. Examples of three-dimensional data are gene-sample-time, individual-feature-time, or node-node-time Data, commonly referred to as context-attribute-observation data. One of the techniques in managing three-dimensional data is triclustering. This study uses the THD Tricluster method to obtain triclustering results in 3-dimensional data on AIDS caused by the HIV-1 virus. The Triclustering search is carried out through biclustering stages carried out in each condition. This study modifies the Cheng & Church (CC) algorithm to produce a bicluster using the measure called transposed virtual error ( which is able to group data based on shifting and scaling patterns. The biclustering results are then sliced under each condition to produce a tricluster. This research was conducted in the RStudio program. Each tricluster has a depth that can be determined depending on the many overlapping conditions. The implementation of the transposed virtual error size on biclustering results in 4 triclusters with a depth of four. The tricluster evaluation was carried out using inter temporal homogeneity and obtained a tricluster correlation value between conditions that was above 0.9. Then, the probe id genes that affect AIDS were analyzed from the results of the triclustering. From this analysis, 2 symbol genes associated with AIDS caused by HIV-1 were found in every condition of HIV-1 sufferers, which are normal, acute, chronic, and non-progressor HIV-1 sufferers, namely HLA-C and ELF-1."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Stefany Nurhatika

Mengombinasikan Metode δ – Trimax dengan Metode Timesvector pada Data Ekspresi Gen Tiga Dimensi = Combining Î´ -Trimax Method with Timesvector Method on Three-Dimensional Gene Expression Data

Analisis triclustering merupakan pengembangan dari analisis clustering dan biclustering. Analisis triclustering bertujuan mengelompokkan data tiga dimensi secara simultan yang menghasilkan submatriks dinamakan tricluster. Pendekatan yang digunakan dalam analisis triclustering di antaranya adalah pendekatan berdasarkan greedy dan pattern. Salah satu contoh pendekatan analisis triclustering berdasarkan greedy adalah metode Î´ – Trimax. Sedangkan salah satu contoh analisis triclustering berdasarkan pattern adalah metode Timesvector. Metode Î´ – Trimax bertujuan menghasilkan tricluster yang memiliki mean square residual kecil dari threshold dengan volume data tricluster yang maksimal. Metode Timesvector bertujuan mengelompokkan matriks data yang menunjukkan pola yang sama atau berbeda pada data tiga dimensi. Implementasi metode Î´ – Trimax dan metode Timesvector pada penelitian ini dilakukan pada data ekspresi gen pasien penderita penyakit periodontitis. Ekspresi gen diukur pada 14 titik kondisi dan 4 titik waktu. Berdasarkan beberapa skenario yang telah diterapkan, metode Î´ – Trimax memberikan hasil terbaik pada saat menerapkan skenario dengan nilai threshold =0,0028564 dan =1,25 dengan jumlah tricluster yang dihasilkan adalah 260 tricluster. Dari 260 tricluster tersebut, dipilih tricluster ke-216 yang dianalisis dengan menggunakan metode Timesvector. Hasil tricluster yang diperoleh dapat menambah wawasan bagi ahli medis dalam memberikan periodontal treatment kepada pasien penderita periodontitis berikutnya.

Triclustering analysis is the development of clustering and biclustering. Triclustering analysis aims to group three-dimensional data simultaneously, forming the initial subspace known as a tricluster. It utilizes two main approaches that are greedy-based and pattern-based approaches, exemplified by the Î´ – Trimax and Timesvector methods, respectively. The Î´ – Trimax method aims for triclusters with smaller mean square residuals than the threshold Î´, while Timesvector groups data matrices with similar or different patterns. In a study on periodontitis patients gene expression data, comprising 14 condition points and 4 time points, both methods were implemented. The Î´ – Trimax method yielded optimal results under specific conditions (Î´ = 0.0028564, Î» = 1.25), producing 260 triclusters. Among these, the 216th tricluster was selected for further analysis using the Timesvector method. The insights gained from these triclusters can enhance periodontal treatment strategies for patients with subsequent periodontitis, providing valuable guidance to medical experts.

"

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Almaira Nabila Ayudhiya

Metode clustering tiga dimensi pada data ekspresi gen menggunakan pendekatan kubus gen = Three-dimensional clustering method on gene expression dataset using the gene cube approach.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Muhammad Fabian Alkautsar

Metode Delta Trimax dengan Silhouette Coefficient dan Genetic Algorithm Optimization Menggunakan Analisis Gene Ontology pada Data Ekspresi Gen Tiga Dimensi = Delta Trimax Method with Silhouette Coefficient and Genetic Algorithm Optimization Using Gene Ontology Analysis on Three-Dimensional Gene Expression Data

"Analisis triclustering adalah metode data mining yang memiliki tujuan untuk mengelompokkan data tiga dimensi. Metode ini kerap kali digunakan untuk bidang bioinformatika. Pada penelitian ini digunakan metode analisis triclustering delta trimax. Delta Trimax pada intinya adalah metode analisis triclustering yang bertujuan untuk menemukan tricluster yang memiliki nilai MSR yang lebih kecil dari nilai threshold (o) yang telah ditentukan. Penggunaan silhouette coefficient pada penelitian ini adalah untuk membantu menentukan nilai threshold (o) tersebut. Hasil triclustering delta trimax nantinya dievaluasi dengan menggunakan Triclustering Quality Index (TQI). Genetic algorithm (GA) adalah sebuah algoritma pencarian yang efisien yang didasari oleh evolusi biologis dan genetika alam. Algoritma GA digunakan untuk menemukan solusi terbaik. Terdapat tiga operator genetika yang digunakan di dalam GA, yaitu seleksi, crossover, dan mutasi. Pada penelitian ini, digunakan data ekspresi gen tiga dimensi dari sel kanker paru-paru fase stabil (A549) yang diberi perlakuan obat kemoterapi Motexafin Gadolinium (MGd) dan mannitol sebagai grup kontrol, dimana ekspresi gen diamati dalam 6 kondisi dan 3 titik waktu. Tujuan dari penelitian ini adalah untuk mengetahui apa kumpulan gen yang memiliki respon baik terhadap pemberian obat kemoterapi MGd dan kondisi apa yang mempengaruhinya. Pada penelitian ini, himpunan tricluster yang memiliki kualitas terbaik berdasarkan Triclustering Quality Index (TQI) adalah himpunan tricluster yang dihasilkan dengan nilai o = 0,004. Berdasarkan himpunan tricluster tersebut, didapatkan informasi penting mengenai kumpulan gen yang memiliki respon baik terhadap pemberian MGd tapi efek obat MGd tidak bertahan di setiap titik waktu. Terdapat juga gen yang menunjukkan respon baik pemberian obat kemoterapi MGd, tetapi efektivitasnya tidak terlalu maksimal karena responnya beririsan dengan subjek yang hanya diberikan mannitol. Setelah itu, dilihat bagaimana hubungan gen yang berasal dari keseluruhan dataset dengan penyakit melalui gene ontology sebagai informasi tambahan untuk perkembangan obat MGd. Nilai fold enrichment tertinggi pada GO biological process adalah Cytoplasmic Translation, pada GO Cellular Component adalah cytosolic ribosome, dan pada GO Molecular Function adalah structural constituent of ribosome.

Triclustering analysis is a data mining method aimed at grouping three-dimensional data. This method is often used in the field of bioinformatics. In this study, the delta trimax triclustering analysis method is used. Delta Trimax essentially aims to find triclusters with Mean Squared Residue (MSR) values smaller than a predetermined threshold (o). The silhouette coefficient is used in this study to help determine the threshold (o). The results of the delta trimax triclustering are then evaluated using the Triclustering Quality Index (TQI). The genetic algorithm (GA) is an efficient search algorithm based on biological evolution and natural genetics. GA is used to find the best solution. There are three genetic operators used in GA: selection, crossover, and mutation. In this study, three-dimensional gene expression data from stable phase lung cancer cells (A549) treated with the chemotherapy drug Motexafin Gadolinium (MGd) and mannitol as a control group were used, where gene expression was observed under 6 conditions and 3 time points. The aim of this study is to identify which sets of genes respond well to MGd chemotherapy and which conditions influence these responses. The set of triclusters with the highest quality based on the Triclustering Quality Index (TQI) was obtained with o=0.004. From this set of triclusters, important information was obtained about the sets of genes that respond well to MGd, but the effect of MGd does not persist at every time point. There are also genes that show a good response to MGd chemotherapy, but its effectiveness is not maximized because the response overlaps with subjects that were only given mannitol. Subsequently, the relationship between genes from the entire dataset and the disease is observed through gene ontology as additional information for the development of MGd drugs. The highest fold enrichment value in the GO biological process is Cytoplasmic Translation, in the GO Cellular Component is cytosolic ribosome, and in the GO Molecular Function is structural constituent of ribosome."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Rosalinda

Metode THD-Tricluster dengan Menggunakan New Residue Score dan Inter Temporal Coherence = THD-Tricluster Method Using New Residue Score and Inter Temporal Coherence

"Metode Triclustering merupakan pengembangan dari metode clustering dan biclustering. Tujuan dari metode triclustering adalah untuk menemukan subruang yang disebut sebagai tricluster. Metode triclustering yang akan dibahas pada penelitian ini adalah metode triclustering berbasis biclustering, yaitu THD-Tricluster dengan menggunakan new residue score dan inter temporal coherence, yang akan diimplementasikan pada data pasien yang terserang HIV-1. Metode triclustering ini terdiri atas dua tahap, yaitu generate biclusters dan generate triclusters. Selanjutnya, inter temporal coherence digunakan untuk mengevaluasi kandidat tricluster yang terbentuk pada tahap generate triclusters dan menentukan tricluster akhir yang terbentuk. Ukuran inter temporal coherence merupakan indeks yang dapat digunakan sebagai ukuran koherensi antarkedalaman dalam mengelompokkan bicluster menjadi tricluster. Pada aplikasinya, ukuran new residue score menggunakan korelasi pearson sebagai landasan untuk mencari nilai residu pada baris dan kolom bicluster. Hasil implementasi untuk tahap generate biclusters diperoleh bahwa terdapat 3 bicluster pada kondisi normal, 100 pada kondisi akut, 100 pada kondisi kronis, dan 13 pada kondisi nonprogresor. Selanjutnya, terdapat sebanyak 33 kandidat tricluster yang terbentuk pada tahap generate triclusters dengan kedalaman masing-masing tricluster adalah 4. Setelah dilakukan evaluasi skor inter temporal coherence dengan threshold Ï=0,8; didapatkan sebanyak 32 tricluster dengan kedalaman 4 dan satu tricluster dengan kedalaman 3 yang memenuhi batas skor koherensi. Keseluruhan penelitian ini dilakukan dengan pemrograman R.

Triclustering method is the development of clustering and biclustering methods. The aim of the triclustering method is to find subspaces, called triclusters. The triclustering method that will be discussed in this study is biclustering-based triclustering method, namely THD-Tricluster using the new residue score and inter temporal coherence, which will be implemented in the data of patients affected by HIV-1. This triclustering method consists of two stages, namely generate biclusters and generate triclusters. Furthermore, inter temporal coherence is used to evaluate candidate triclusters that formed at the stage of generating triclusters and determine the final triclusters. Inter temporal coherence is an index that can be used as a measure of coherence between depths in grouping biclusters into triclusters. In its application, the new residue score measure uses Pearson correlation as the basis for finding residual values in bicluster rows and columns. The implementation results for the generate biclusters stage showed that there were 3 biclusters in normal conditions, 100 in acute conditions, 100 in chronic conditions, and 13 in non-progressor conditions. Furthermore, there were 33 candidate triclusters formed at the generate triclusters stage with the depth of each tricluster being 4. After an evaluation of inter temporal coherence score with threshold ; obtained 32 triclusters with a depth of 4 and one tricluster with a depth of 3 which met the coherence score limits. This whole research was conducted by the R programming."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Rana Amalia Putri

Analisis Tricluster Menggunakan Metode Hybrid ?-TRIMAX Discrete Firefly Optimization pada Data Ekspresi Gen Tiga Dimensi = Tricluster Analysis with The Hybrid Î´-TRIMAX Discrete Firefly Optimization Method on Three-Dimensional Gene Expression Data

"Triclustering merupakan teknik data mining untuk mengelompokkan data tiga dimensi (observasi – atribut – konteks). Metode triclustering mampu menemukan kelompok observasi dengan karakteristik yang mirip pada beberapa atribut dan konteks sekaligus. Analisis tricluster kerap diimplementasikan pada data ekspresi gen 3D (gen – kondisi – waktu). Pada penelitian ini dilakukan analisis tricluster dengan metode Hybrid Discrete Firefly Optimization (DFO) pada data ekspresi gen 3D. Metode ini merupakan kombinasi dari metode dan Discrete Firefly Optimization (DFO). Metode DFO merupakan metode optimasi yang terinspirasi dari perilaku firefly (kunang-kunang) yang selalu bergerak ke arah firefly lain dengan cahaya yang lebih terang. Metode DFO bertujuan untuk memperoleh tricluster terbaik dengan volume maksimum dari suatu populasi tricluster. Pada metode DFO, suatu tricluster dengan volume lebih kecil akan bergerak ke arah tricluster lain dengan volume lebih besar dengan bantuan crossover operator. Setiap iterasi pada metode DFO dilakukan sampai semua tricluster dibandingkan volumenya dengan satu sama lain sehingga tricluster dengan volume lebih kecil dapat diperbaiki posisinya dan meningkat volumenya. Kebaruan dari penelitian ini merupakan pembentukan populasi tricluster awal dilakukan dengan metode . Metode bertujuan untuk menghasilkan tricluster dengan Mean Squared Residue (MSR) minimum, yaitu di bawah threshold tertentu. Populasi tricluster dengan karakteristik demikian meringankan beban dan waktu komputasi pada metode DFO. Data yang digunakan pada analisis tricluster ini merupakan data ekspresi gen dari sel kanker payudara MCF-7 ketika disuntikkan 100 nM hormon estrogen untuk empat waktu berbeda, yaitu selama 0 jam, 3 jam, 6 jam, dan 12 jam. Masing-masing perlakuan direplikasi sebanyak tiga kali. Pada penelitian ini diperoleh bahwa simulasi yang menghasilkan tricluster akhir terbaik dengan TQI terkecil adalah simulasi dengan nilai sebesar 3E-05. Gen-gen yang termasuk ke dalam tricluster ini memiliki profil ekspresi yang mirip ketika disuntikkan 100nM estrogen untuk tiga replikasi dan empat waktu. Estrogen merupakan salah satu hormon yang mempengaruhi pertumbuhan kanker payudara. Oleh karena itu, kumpulan gen dari tricluster yang diperoleh dapat dijadikan acuan pada penelitian selanjutnya oleh ahli medis terkait pengaruh estrogen terhadap kanker payudara dan untuk menentukan target terapi gen kanker payudara.

Triclustering is a data mining technique that is used to group observations on three dimensional data which consists of observation, attribute, and context dimension. Triclustering is used to find a group of observations with high similarity on several attributes and several contexts. Triclustering analysis is often implemented on three dimensional gene expression dataset. The 3D gene expression dataset dimensions consist of gene, condition, and time. The triclustering method that is used on this research is the Hybrid Discrete Firefly Optimization (DFO). This method is a combination of and DFO. Discrete Firefly Optimization (DFO) is an optimization method that was inspired by firefly movement in the wild in which a less bright firefly always moves to the one with brighter light. In triclustering analysis, every tricluster is called a firefly. Every firefly has a fitness value which is measured by its volume and a position which is represented by a binary encoding of its elements. The DFO method is used to find the best tricluster with maximum volume from a population of triclusters. In the DFO method, a tricluster with smaller volume will move towards a tricluster with larger volume. The movement is done by updating the smaller volume tricluster position. The new position is obtained through crossover operator. Every iteration of DFO is completed once every tricluster fitness value is compared to each other. Repeating the DFO iteratively will give the end result of the best tricluster with maximum volume. The novelty of this research is the addition of method in constructing the initial tricluster population. The population created from will have MSR lower than the threshold so the computation time in the optimization step can be reduced. The Hybrid DFO method is implemented on a 3D gene expression dataset related to the MCF-7 breast cancer cell. The cell is injected with 100nM estrogen for four different times, i.e. 0, 3, 6, and 12 hours. Every experiment is repeated three times. This research finds that the simulation with the best tricluster based on the TQI score is the simulation with equals to 3E-05. The genes that are included in the tricluster are found to have exhibit similar expression when injected by 100nM for three conditions and four time periods. Estrogen is one of the hormones that can affect breast cancer growth. Therefore, the genes that are included in the tricluster can be used as a reference for medical researchers in future research related to estrogen-induced breast cancer and to assist the selection for genes target in breast cancer therapy."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Airlangga Muhammad Putrapradana

Analisis Triclustering Menggunakan Metode Gabungan Fuzzy Cuckoo Search dengan δ-Trimax pada Data Ekspresi Gen Tiga Dimensi = Triclustering Analysis Using Hybrid Fuzzy Cuckoo Search with Î´-Trimax Method on Three Dimensional Gene Expression Data

"Analisis triclustering merupakan salah satu metode data mining yang bertujuan mengelompokkan data berbentuk tiga dimensi. Triclustering kerap digunakan pada bidang bioinformatika untuk menganalisis kesamaan ekspresi gen suatu eksperimen pada titik waktu tertentu. Analisis triclustering yang dilakukan pada penelitian ini menggunakan metode gabungan Fuzzy Cuckoo Search dengan I-Trimax. Metode ini merupakan penggabungan algoritma nodes deletion pada I-Trimax dengan algoritma optimasi Fuzzy Cuckoo Search. Cuckoo Search merupakan metode optimasi yang sudah baik dalam menghasilkan himpunan tricluster yang menggunakan konsep parasitisme spesies cuckoo. Fuzzy Cuckoo Search menggunakan fungsi objektif fuzzy c-means untuk mengatasi ketidakjelasan (indiscernibility) yang biasa terjadi dalam data ekspresi gen sehingga masalah kesulitan membedakan objek karena kurangnya pengetahuan dari informasi yang tersedia dapat diatasi. Algoritma nodes deletion pada I-Trimax digunakan pada fase pembentukan populasi awal dari metode gabungan Fuzzy Cuckoo Search dengan I-Trimax. Hal ini dilakukan demi mendapatkan populasi awal yang sudah baik yaitu memiliki MSR yang minimum karena konsep dari algoritma nodes deletion yaitu dapat menghasilkan himpunan tricluster dengan Mean Square Residue (MSR) kecil yaitu di bawah threshold. Berdasarkan itu proses komputasi algoritma Fuzzy Cuckoo Searchyang dilakukan pada fase optimasi dapat berjalan dengan efektif sehingga menghasilkan himpunan tricluster yang berkualitas baik secara efisien. Analisis triclustering menggunakan metode gabungan Fuzzy Cuckoo Search dengan I-Trimax digunakan pada data ekspresi gen tiga dimensi sel kanker paru-paru fase stabil (A549) yang berkaitan dengan pemberian obat kemoterapi Motexafin Gadolinium (MGd), di mana ekspresi gen diamati pada 6 kondisi dan 3 titik waktu. Pada penelitian ini, himpunan tricluster yang memiliki kualitas terbaik berdasarkan Triclustering Quality Index (TQI) adalah himpunan tricluster yang dihasilkan dengan nilai dan. Berdasarkan himpunan tricluster tersebut, didapatkan informasi penting mengenai kumpulan gen yang memiliki respon baik terhadap pemberian MGd tapi tidak bertahan setiap titik waktu. Hal ini dapat dijadikan acuan penelitian terkait terapi kanker menggunakan obat kemoterapi MGd yang perlu dilakukan pengembangan agar dapat tetap efektif pada seluruh titik waktu. Terdapat juga kumpulan gen yang memiliki respon cepat dan bertahan hingga jangka panjang dengan pemberian MGd dan mannitol. Gen-gen tersebut merupakan gen yang menunjukkan respon baik pemberian obat kemoterapi MGd tetapi efektivitasnya tidak terlalu maksimal karena responnya beririsan dengan subjek yang hanya diberikan mannitol. Hal ini dapat dijadikan bahan untuk penelitian lebih lanjut dalam pengembangan obat MGd supaya dapat lebih efektif.

Triclustering analysis is a data mining method that aims to group data in three dimensions. Triclustering is often used in the field of bioinformatics to analyze the similarity of gene expression under experimental conditions at a certain point in time. The triclustering analysis carried out in this study used the combined Fuzzy Cuckoo Search method with -Trimax. This method is a combination of node deletion algorithm on -Trimax with Fuzzy Cuckoo Search optimization algorithm. Cuckoo Search is a good optimization method in generating tricluster sets that use the concept of parasitism of cuckoo species. Fuzzy Cuckoo Search uses the fuzzy c-means objective function to overcome the indiscernibility that usually occurs in gene expression data so that the problem of difficulty distinguishing objects due to lack of knowledge from available information can be overcome. The nodes deletion algorithm on I-Trimax is used in the initial population formation phase from the combined Fuzzy Cuckoo Search method with I-Trimax. This is done in order to get a good initial population, which has a minimum MSR because the concept of the nodes deletion algorithm is that it can produce a tricluster set with a small Mean Square Residue (MSR), which is below the threshold. Based on that, the computational process of the Fuzzy Cuckoo Search algorithm which is carried out in the optimization phase can run effectively so as to produce a good quality tricluster set efficiently. Triclustering analysis using the combined Fuzzy Cuckoo Search method with I-Trimax was used on three-dimensional gene expression data of stable phase lung cancer cells (A549) associated with the administration of the chemotherapy drug Motexafin Gadolinium (MGd), where gene expression was observed in 6 conditions and 3 time points. In this study, the tricluster set that has the best quality based on the Triclustering Quality Index (TQI) is the resulting tricluster set with values. Based on these tricluster sets, important information was obtained regarding gene pools that responded well to MGd administration but did not persist at any point in time. This can be used as a reference for research related to cancer therapy using MGd chemotherapy drugs that need to be developed in order to remain effective at all time points. There is also a gene pool that responds quickly and persists in the long term with MGd and mannitol administration. These genes are genes that show a good response to MGd chemotherapy drugs but their effectiveness is not maximal because their responses coincide with subjects who are only given mannitol. This can be used as material for further research in the development of MGd drugs so that they can be more effective."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian