Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 100430 dokumen yang sesuai dengan query
cover
Ika Marta Sari
"

Analisis triclustering merupakan pengembangan dari analisis clustering dan analisis biclustering. Tujuan dari analisis triclustering yaitu mengelompokkan data tiga dimensi secara simultan atau bersamaan. Data tiga dimensi tersebut dapat berupa observasi, atribut, dan konteks. Salah satu pendekatan yang digunakan dalam analisis triclustering, yaitu pendekatan berdasarkan pattern contohnya, adalah metode Timesvector. Metode Timesvector bertujuan untuk mengelompokkan matriks data yang menunjukkan pola yang sama atau berbeda pada data tiga dimensi. Metode Timesvector memiliki langkah kerja yang dimulai dengan mereduksi matriks data tiga dimensi menjadi matriks data dua dimensi untuk mengurangi kompleksitas dalam pengelompokkan. Pada metode ini akan digunakan algoritma Spherical K-means dalam pengelompokkannya. Tahap selanjutnya, yaitu mengidentifikasi pola dari cluster yang dihasilkan pada Spherical K-means. Pola yang dimaksud terdiri dari tiga jenis, yaitu DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), dan SEP (Similarly Expressed Pattern). Penerapan dari metode Timesvector dilakukan pada data ekspresi gen yaitu data tumor otak yang dilakukan dalam 6 skenario. Masing-masing skenario menggunakan banyak cluster yang sama tetapi nilai threshold yang berbeda-beda. Hasil dari ke enam skenario akan divalidasi menggunakan nilai coverage dan nilai tricluster diffusion (TD). Hasil penerapan metode timesvector menunjukkan bahwa dengan menggunakan threshold sebesar 1,5 memberikan hasil yang paling optimal karena memiliki nilai coverage yang tinggi sebesar 57% dan nilai TD yang rendah sebesar 2,95594E-06. Nilai coverage yang tinggi menunjukkan kemampuan metode dalam mengekstrak data dan nilai TD yang rendah menunjukkan bahwa tricluster yang dihasilkan memiliki volume yang besar dan koherensi yang tinggi. Berdasarkan pola yang dihasilkan menggunakan skenario yang optimal diperoleh sebanyak 49 ODEP cluster dengan pasien ke-empat selalu memiliki pola ekspresi yang berbeda dibandingkan dengan pasien lainya.  Hal ini dapat digunakan oleh ahli medis untuk melakukan tindakan selanjutnya terhadap pasien tumor otak.

 


Triclustering analysis is the development of clustering analysis and biclustering analysis. The purpose of triclustering analysis is to group three-dimensional data simultaneously or simultaneously. The three-dimensional data can be in the form of observations, attributes, and context. One of the approaches used in triclustering analysis, namely an approach based on a pattern, for example, is the Timesvector method. Timesvector method aims to group data matrices that show the same or different patterns in three-dimensional data. The Timesvector method has a work step that starts with reducing the three-dimensional data matrix to a two-dimensional data matrix to reduce complexity in a grouping. In this method, the Spherical K-means algorithm will be used in grouping it. The next step is to identify the pattern of the clusters generated in the Spherical K-means. The pattern referred to consists of three types, namely DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), and SEP (Similar Expressed Pattern). The application of the Timesvector method was carried out on gene expression data, namely brain tumor data carried out in 6 scenarios. Each scenario uses the same many clusters but different threshold values. The results of the six scenarios will be validated using the coverage value and the tricluster diffusion (TD) value. The results of applying the timesvector method show that using a threshold of 1.5 gives the most optimal results because it has a high coverage value of 57% and a low TD value of 2.95594E-06. A high coverage value indicates the method's ability to extract data and a low TD value indicates that the resulting tricluster has a large volume and high coherence. Based on the pattern generated using the optimal scenario, there were 49 ODEP clusters with the fourth patient always having a different expression pattern compared to other patients. This can be used by medical experts to perform further action on brain tumor patients.

 

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Almaira Nabila Ayudhiya
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Awlia Dwi Rachma
"

Metode THD-Tricluster merupakan analisis triclustering dengan pendekatan berbasis biclustering. Pada metode THD-Tricluster digunakan nilai Shifting-and-Scaling Similarity untuk membentuk bicluster terlebih dahulu dan dilanjutkan dengan membentuk tricluster. Nilai SSSim menggunakan Shifting-and-Scaling Correlation untuk mendeteksi adanya  korelasi antaranggota dengan pola pergeseran dan penskalaan serta koherensi antarwaktu dan membandingkannya dengan nilai threshold. Metode THD-Tricluster dilakukan pada data respon pengobatan terapi interferon-beta pada pasien sklerosis ganda. Skenario optimal adalah skenario dengan nilai coverage terkecil yaitu saat menggunakan nilai threshold tertinggi. Pada skenario tersebut diperoleh dua jenis tricluster yaitu tricluster yang memiliki kumpulan gen pada pasien yang responsif dan pasien yang tidak responsif terhadap terapi. Perbedaan kumpulan gen pada kedua tricluster dapat digunakan oleh para ahli medis untuk mengembangkan pengobatan terapi  untuk meningkatkan tingkat keresponsifan pasien sklerosis ganda terhadap terapi tersebut.


The THD-Tricluster method is a triclustering analysis with a biclustering-based approach. The THD-Tricluster method uses the Shifting-and-Scaling Similarity value to form a bicluster first and shows it by forming a tricluster. The SSSim value uses Shifting-and-Scaling Correlation to use an interface with shifting and scaling patterns as well as intertemporal coherence and compares it with the threshold value. The THD-Tricluster method was performed on treatment response data to interferon-beta therapy in multiple sclerosis patients. The optimal scenario is a scenario with a coverage value scenario that uses the highest threshold value. In this scenario, there are two types of tricluster, namely the tricluster which has a collection of genes in responsive patients and patients who are not responsive to therapy. Differences in gene pools in the two tricluster can be used by medical professionals to develop IFN-β therapeutic treatments to increase the responsiveness of multiple sclerosis patients to these therapies.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Latif Raditya Rusdi
"Triclustering merupakan salah satu teknik data mining yang bertujuan untuk mengelompokkan data berbentuk tiga dimensi secara simultan. Salah satu pendekatan yang digunakan dalam triclustering adalah pendekatan pattern-based, contohnya Timesvector. Metode timesvector dirancang khusus untuk pengelompokan data deret waktu tiga dimensi yang bertujuan menangkap pola ekspresi gen yang sama atau berbeda antara dua atau lebih kondisi eksperimen. Implementasi metode timesvector dilakukan pada data ekspresi gen human embryonic stem cell (H1-hESC) yang diberi protein morfogenetik tulang (BMP4) dan dikondisikan di dalam ruang dengan tingkat oksigen 4% dan 20, serta diamati pada 6 titik waktu berbeda selama 120 jam. Triclustering dilakukan dengan lima skenario menggunakan cluster sejumlah 257 dan threshold yang berbeda. Berdasarkan skenario tersebut, metode timesvector menghasilkan skenario terbaik pada skenario dengan threshold 1,5 yang menggunakan validasi berdasarkan nilai coverage. Berdasarkan hasil skenario terbaik, dihasilkan 9 pola DEP, 24 pola ODEP, dan 37 pola SEP dan dari pola tersebut dilakukan analisis Gene Ontology (GO) untuk mengukur kualitas tricluster dalam penggambaran konsep GO. Analisis GO menggunakan Database for Annotation, Visualization, and Integrated Discovery (DAVID) tools untuk menghitung nilai p-value. Pada analisis GO dipilih p-value terkecil pada pola DEP, ODEP, dan SEP sebagai tricluster terbaik, yaitu DEP pada tricluster ke 8, ODEP pada tricluster ke-1, dan SEP pada tricluster ke-26. Berdasarkan tricluster terbaik pada pola DEP dan ODEP dapat dikatakan bahwa kondisi oksigen tingkat fisiologis 4 % dan tingkat atmosfer 20 % memiliki perbedaan dalam mengidentifikasi gen kandidat pada H1-hESC yang mampu berdiferensiasi menjadi trofoblas, sedangkan SEP tidak memiliki perbedaan dalam mengidentifikasi gen kandidat pada H1-hESC dengan dua kondisi berbeda.

Triclustering is one of the data mining techniques that aims to cluster three-dimensional data simultaneously. One of the approaches used in triclustering is a pattern-based approach, such as Timesvector. The timesvector method is specifically designed for clustering three-dimensional time series data that aims to capture gene expression patterns that are the same or different between two or more experimental conditions. The implementation of the timesvector method was performed on human embryonic stem cell (H1-hESC) gene expression data treated with bone morphogenetic protein (BMP4) and conditioned in a chamber with 4% and 20 oxygen levels and observed at 6 different time points for 120 hours. Triclustering was performed with five scenarios using 257 clusters and different thresholds. Based on these scenarios, the timesvector method produces the best scenario in the scenario with a threshold of 1.5 which uses validation based on the coverage value. Based on the results of the best scenario, 9 DEP patterns, 24 ODEP patterns, and 37 SEP patterns were generated from these patterns. Gene Ontology (GO) analysis was carried out to measure the quality of the tricluster in describing the GO concept. GO analysis uses Database for Annotation, Visualization, and Integrated Discovery (DAVID) tools to calculate the p-value. In the GO analysis, the smallest p value in the DEP, ODEP, and SEP patterns was selected as the best tricluster, namely DEP in the 8th tricluster, ODEP in the 1st tricluster, and SEP in the 26th tricluster. Based on the best tricluster in the DEP and ODEP patterns, it can be said that the oxygen conditions of 4% physiological level and 20% atmospheric level have differences in identifying candidate genes in H1-hESC that are able to differentiate into trophoblasts, while SEP has no difference in identifying candidate genes in H1-hESC with two different conditions."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dwi Aji Apriana
"Triclustering merupakan salah satu metode data mining yang juga merupakan pengembangan dari metode biclustering dan clustering. Metode tersebut mengelompokkan set data berupa matriks tiga dimensi (gen, kondisi, dan waktu) menjadi kelompok-kelompok submatriks yang memiliki kesamaan satu sama lain. Salah satu algoritma dari analisis triclustering adalah Extended Dimension Iterative Signature Algorithm (EDISA). Algoritma ini mempertimbangkan jarak Pearson antara tiap gen dan kondisi terhadap vektor rata-rata sebagai ukuran kemiripan. Proses pertama dari EDISA adalah langkah preprocessing yaitu menghapus gen yang memiliki nilai ekspresi gen yang berbeda sangat signifikan dengan nilai ekspresi gen lainnya. Lalu langkah selanjutnya yaitu memilih sebanyak s sampel gen dengan cara memilih satu gen secara random untuk menjadi seed gen, lalu mencari sebanyak s-1 gen yang memiliki jarak Pearson terdekat dengan seed gen tersebut. Tahap berikutnya membuat vektor bobot gen dan kondisi, lalu memasangkannya dengan sampel gen yang telah terpilih, kemudian menghitung vektor rata-ratanya. Proses selanjutnya yaitu proses iterasi di mana setiap gen dan kondisi yang memiliki jarak Pearson terhadap vektor rata-rata di atas ambang batas tertentu (TG dan TG, keduanya merupakan ukuran seberapa baik keselarasan suatu gen dan kondisi terhadap rata-rata kandidat tricluster) harus dihapus karena dianggap tidak memiliki kemiripan yang cukup dengan anggota tricluster lain pada setiap iterasinya. Proses selanjutnya adalah postprocessing yang bertujuan untuk menggabungkan tricluster yang memiliki kemiripan untuk dijadikan tricluster yang lebih besar dan dijadikan sebagai kumpulan tricluster final. Algoritma ini diterapkan pada data ekspresi gen penyakit paru-paru. Penerapan algoritma tersebut menggunakan beberapa skenario dengan nilai Tg dan TG yang berbeda. Hasil dari penerapan pada data ekspresi gen penyakit paru-paru diperoleh bahwa semakin besar nilai TG, maka jumlah gen yang dapat masuk ke dalam tricluster makin banyak, dan semakin besar nilai TG, maka jumlah kondisi yang dapat masuk ke dalam tricluster juga makin banyak. Selain itu, dilakukan evaluasi dari tricluster menggunakan nilai Tricluster Diffusion Score (TD Score) untuk mencari skenario terbaik. Didapat bahwa skenario terbaik merupakan skenario dengan nilai Tg=0,3 dan nilai TG=0,2. Melalui algoritma ini dapat dideteksi gen-gen yang dapat membedakan karakteristik pasien yang berpenyakit paru-paru dan pasien yang sehat."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sanjung Maharani
"Triclustering merupakan salah satu teknik data mining pada data tiga dimensi untuk mengelompokkan data secara bersamaan pada baris dan kolom di titik waktu yang berbeda menjadi tricluster. Metode ini umumnya diterapkan pada bidang bioinformatika, khususnya data ekspresi gen tiga dimensi. Salah satu triclustering dengan pendekatan biclustering-based adalah THD-Tricluster. Langkah utama dari algoritma ini ialah generate bicluster dan genereate tricluster. Algoritma THD-Tricluster menggunakan pola pergeseran dan penskalaan dengan nilai Shifting-and-Scaling-Similarity (SSSim) untuk mengelompokkan gen dan menghasilkan tricluster. Hasil dari THD-Tricluster dievaluasi dengan Multi Slope Measure (MSL) yaitu sebuah pengukuran kualitas melalui representasi grafik dari tricluster. Dalam penelitian ini, data yang digunakan adalah data respon tiga sel individu terhadap pemberian sitokin berupa interleukin-1-beta pada sel mesenkim amnion manusia atau sel pada membran janin. Sitokin memicu regulasi gen inflamasi yang berkontribusi pada kelahiran prematur. Metode THD-Tricluster diimplementasikan pada 15 skenario dengan nilai threshold berbeda. Skenario yang optimal dipilih menggunakan nilai validasi coverage. Pada skenario optimal, diperoleh delapan tricluster yang kemudian dievaluasi menggunakan Multi Slope Measure (MSL). Tricluster 2 yang memiliki nilai MSL paling kecil dan dipilih sebagai tricluster optimal terdiri atas kumpulan gen dari sel yang responsif terhadap pemberian sitokin berupa interleukin-1-beta. Gen-gen pada Tricluster 2 inilah yang dapat digunakan sebagai bahan pertimbangan bagi para peneliti di bidang biologis dan medis untuk untuk penelitian lebih lanjut terkait kelahiran prematur.

Triclustering is one of the data mining techniques on three-dimensional data to cluster data simultaneously in rows and columns at different time points into triclusters. This method is generally applied to the field of bioinformatics, especially three-dimensional gene expression data. One of the triclustering methods with a biclustering-based approach is THD-Tricluster. The main steps of this algorithm are generate bicluster and generate tricluster. THD-Tricluster algorithm uses shifting and scaling patterns with Shifting-and-Scaling-Similarity (SSSim) values to cluster genes and generate tricluster. The result of THD-Tricluster is evaluated by Multi Slope Measure (MSL), a measurement of tricluster quality through graphical representation. In this study, the data used is the response data of three individual cells to cytokine in the form of interleukin-1-beta in human amniotic mesenchymal cells or cells in the fetal membrane. Cytokines stimulate the regulation of inflammatory genes that contribute to preterm birth. The THD-Tricluster method was implemented on 15 scenarios with different threshold values. The optimal scenario was selected using the coverage validation value. In the optimal scenario, eight triclusters were obtained which were then evaluated using Multi Slope Measure (MSL). Tricluster 2 which has the smallest MSL value and selected as the optimal consists of a collection of genes from cells that are responsive to cytokine administration in the form of interleukin-1-beta. The genes in Tricluster 2 can be used by biological and medical researchers to develop treatments to prevent premature birth."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Elke Annisa Octaria
"

Triclustering merupakan teknik analisis pada data 3D yang bertujuan untuk mengelompokkan data secara bersamaan pada baris dan kolom di sepanjang waktu/kondisi yang berbeda. Hasil dari teknik ini disebut dengan tricluster. Tricluster merupakan subruang berupa subset dari baris, kolom, dan waktu/kondisi. Triclustering biasanya digunakan untuk menganalisis data ekspresi gen. Studi dan analisis data ekspresi gen selama perkembangan suatu penyakit merupakan masalah penelitian yang penting dalam bioinformatika dan aspek klinis. Oleh karena itu, penelitian ini mengimplementasikan metode THD-Tricluster dengan new residue score pada data ekspresi gen perkembangan penyakit HIV-1 yang terdiri dari 22283 probe id, 40 observasi, dan 4 kondisi. Pada tahap pertama dilakukan pencarian bicluster dengan lift algorithm berdasarkan nilai new residue score dengan threshold . Pada tahap kedua dilakukan pencarian tricluster dengan menentukan minimum probe dan minimum observasi  sehingga memperoleh 33 tricluster. Hasil evaluasi tricluster menggunakan Inter-temporal Homogeneity dengan threshold  diperoleh 32 tricluster yang menunjukkan 3 gen yang terkait dengan HIV-1 yaitu HLA-C, ELF-1, dan JUN.


Triclustering is an analysis technique on 3D data that aims to group data simultaneously on rows and columns across different times/conditions. The result of this technique is called a tricluster. Triclusters are a subspace consisting of a subset of rows, columns, and time/conditions. Triclustering is commonly used to analyze gene expression data. The study and analysis of gene expression data during disease progression is an important issue in the research of bioinformatics and clinical aspects. Therefore, this study implements the THD-Tricluster method with a new residue score on the gene expression data for HIV-1 disease progression consisting of 22283 probe id, 40 observations, and 4 conditions. In the first stage, a bicluster search was carried out with a lift algorithm based on the new residue score with a threshold of I = 0.08. In the second stage, the tricluster search was carried out by determining the minimum probe = 5 and the minimum observation = 2 to obtain 33 triclusters. The results of the tricluster evaluations using Inter-temporal Homogeneity with a threshold of Ï? = 0.8 obtained 32 triclusters which shows 3 genes related to HIV-1, namely HLA-C, ELF-1, and JUN.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Adib Hanafi
"Teknologi microarray merupakan salah satu teknologi yang berkembang dalam bidang bioinformatika. Salah satu teknologi microarray dalam bidang kesehatan, yaitu untuk mendeteksi adanya gen pada DNA individu yang menghasilkan data ekspresi gen. Pada data ekspresi gen, sering kali ditemukan informasi yang hilang sehingga membuat terhambatnya analisis lebih lanjut pada data ekspresi gen. Pada penelitian ini, diusulkan metode imputasi missing values Sequential Biclustering berbasis Shifting-and-Scaling Similarity dan Mean Square Residue (SSSim-MSR). Penentuan anggota bicluster dengan kesamaan sifat co-expressed dan pendeteksian pola shifting-and-scaling dilakukan berdasarkan pada skor Mean Squared Residue (MSR) dan skor Shifting-and-Scaling Similarity (SSSim) antara masing-masing gen dengan gen yang mengandung missing values. Performa metode diukur dengan skor korelasi Pearson dan skor NRMSE, lalu dibandingkan dengan metode Chronological Biclustering berbasis PCor-MSRE. Berdasarkan pada skor korelasi Pearson, metode Sequential Biclustering dengan basis SSSim-MSR merupakan metode yang cukup baik dibandingkan metode Chronological Biclustering berbasis PCor-MSRE pada missing rate sebesar 20% dan 50% untuk setiap nilai k. Untuk setiap missing rate pada nilai k lainnya, skor korelasi Pearson yang dihasilkan belum tentu bernilai lebih besar untuk nilai k yang lebih besar. Hal ini dapat terjadi karena perseberan porporsi pola shifting-and-scaling dan yang tidak berpola shifting-and-scaling pada data yang digunakan cenderung sama, sehingga pada tahap pembentukan bicluster yang didasarkan pada keserupaan pola dan pendeteksian pola shifting-and-scaling dapat memengaruhi keserupaan pola yang dibentuk.

Microarray technology is one of the emerging technologies in the field of bioinformatics. One of the microarray technologies in the health sector is to detect the presence of genes in individual DNA that produce gene expression data. In gene expression data, missing information is often found, which hinders further analysis of gene expression data. In this study, a method of imputing missing values Sequential Biclustering based on Shifting-and-Scaling Similarity and Mean Square Residue (SSSim - MSR) is proposed. Determination of bicluster members with similar co-expressed characteristics and detection of shifting-and-scaling patterns is carried out based on the score. Mean Squared Residue (MSR) and Shifting-and-Scaling Similarity (SSSim) scores between each gene and genes containing missing values. The performance of the method was measured by the Pearson correlation score and the NRMSE score, then compared with the Chronological Biclustering method on the basis of PCor – MSRE. Based on the Pearson correlation score, the Sequential Biclustering method on the basis of SSSim – MSR is a fairly good method compared to the Chronological Biclustering method at a missing rate of 20% and 50% for each value of k. For each other missing rate for k values, the resulting Pearson correlation score is not necessarily greater for larger k values. This can happen because the proportions of shifting-and-scaling and non-shifting-and-scaling patterns in the data used tend to be the same, so that at the stage of bicluster formation based on pattern similarity and detection of shifting-and-scaling patterns can detect similarity of pattern."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Achmad Eriza Aminanto
"Analisis biclustering merupakan pengembangan analisis clustering, dimana analisis biclustering merupakan proses partisi data matriks menjadi sub-matriks berdasarkan baris dan kolom secara simultan. Salah satu metode analisis bicluster yaitu dengan menggunakan model probabilistik, contohnya adalah Plaid model yang dapat memberikan hasil bicluster yang bersifat overlapping. Plaid model, memperhitungkan nilai elemen yang diberikan dari suatu sub-matriks tertentu, sehingga pada analisis biclustering dapat dilihat sebagai jumlah kontribusi atau efek dari bicluster tertentu. Tahapan analisis biclustering dengan plaid model diawali dengan input data berbentuk matriks, kemudian dilakukan penaksiran model awal dan membuat matriks residual dari model tersebut. Kemudian penentuan kandidat bicluster. Kandidat tersebut ditaksir parameter efeknya dan parameter keanggotaan bicluster. Terakhir dilakukan pemangkasan kandidat bicluster tersebut. Implementasi dilakukan pada data matriks ekspresi gen berupa data numerik yaitu data penyakit kanker usus, dimana baris berisikan observasi atau pasien sedangkan kolom berisikan jenis dari gen yang dilakukan dalam 6 skenario. Masing-masing skenario menggunakan parameter model dan nilai threshold berbeda. Validasi hasil implementasi menggunakan indeks Jaccard yaitu kedektahan hasil anggota bicluster dan variansi koherensi. Hasil implementasi menunjukkan penggunaan model yang lebih sederhana yang hanya menggunakan efek mean memberikan variansi koherensi yang lebih tinggi dibandingkan penggunaan model yang berisi mean, efek baris, dan efek kolom dari bicluster.

Biclustering analysis is the development of clustering analysis, which is the process of partitioning matrix data into sub-matrices based on rows and columns simultaneously. One method of bicluster analysis is using probabilistic model, for example the Plaid model that provide overlapping bicluster. Plaid model, calculates the value of an element given from a particular sub-matrix, thus can be seen as number of contributions of particular bicluster. The process begins with matrix data input, then an initial model is assessed and makes a residual matrix from the model. Then determining bicluster candidates. The candidate assessed for its effect parameters and bicluster membership parameters. Finally, the bicluster candidate was prunned. The implementation is carried out on the gene expression matrix data in form of numerical data, namely colon cancer data, where the rows contain observations while the columns contain the types of genes carried out in 6 scenarios. Each scenario uses different model parameters and threshold values. Validation of the implementation results using Jaccard index and coherence variance. Implementation results show that simpler model which only uses mean effect gives higher coherence variance than using model that contains mean, row, and column effect of the bicluster."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hendy Fergus Atheri Hura
"ABSTRAK
Penelitian ini mengimplementasikan metode spectral clustering-Fuzzy C-Means pada tiga microarray data ekspresi gen, dengan tujuan untuk mengelompokkan gen-gen yang memiliki tingkat ekspresi yang similar. Spectral clustering secara teoritis terdiri dari tiga tahap utama yaitu: membangun matriks jarak, membentuk matriks Laplacian, dan proses partisi, khususnya dalam tesis ini menggunakan algoritma partisi Fuzzy C-Means. Oleh karena itu, implementasi dari spectral clustering-FCM lebih sederhana dan intuitif pada pelaksanaannya. Analisis cluster singkat juga akan dipaparkan untuk masing-masing microarray data yang digunakan yaitu: Carcinoma, Leukemia, dan Lymphoma. Hasil cluster yang sangat baik didapatkan, sehingga metode yang diusulkan memiliki potensi besar ke depannya dalam penelitan pada bidang medis.

ABSTRACT
This research implements the spectral clustering FCM method on three microarray gene expression data, with the aim of grouping genes with similar expression levels. Spectral clustering is theoretically composed of three main stages building distance matrix, forming Laplacian matrix, and partitioning process, especially in this thesis using Fuzzy C Means partition algorithm. Therefore, the implementation of spectral clustering FCM is simpler and more intuitive in its implementation. Brief cluster analysis will also be presented for each microarray data used Carcinoma, Leukemia, and Lymphoma. Excellent cluster results are obtained, so the proposed method has great potential for future research in the medical field. "
2017
T48274
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>