Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 32 dokumen yang sesuai dengan query
cover
Ari Fahrial Syam
"The development and progression of cancer and the experimental reversal of tumorigenicity are companied by complex changes in the pattern of gene expression.
DNA micro-array technology is used to profile complex disease and discover novel disease-related genes. This technique has been successfully used to investigate gene expression in processes as complex as inflammatory disease, tumor suppression and to identify heat shock in human T cell.
DNA micro-arrays or DNA-chip technology allows expression monitoring of hundreds and thousands of genes simultaneously and provide a format for identifying genes as well as changes in their activity. The DNA micro-array helps us study genome-wide expression patterns in complex biological systems. These tools have shown great promise in finding the meaning of complex diseases such as cancer.
There is some interest in the potential application of DNA micro-array analysis for gene expression profiling in human cancers. Micro-arrays of DNA provide a powerful tool for studying the development and progression of cancer phenomena. It might be useful for tumor classification, for the elucidation of regulatory networks that are disturbed in tumor cells and for the identification of genes that might be of use for diagnostic purposes or as therapeutic targets."
2003
AMIN-XXXV-1-JanMarc2003-49
Artikel Jurnal  Universitas Indonesia Library
cover
Heri Kurnia Andika
"Penyakit Alzheimer adalah penyakit bersifat neurodegenerative atau terdapat penurunan fungsi pada neuron yang bercirikan terdapat gangguan memori yang parah pada bagian otak. Penelitian ini bertujuan menganalisis Alzheimer disease (AD) dalam bentuk data microarray untuk mencari bicluster dengan algoritma BicHPT (Biclustering based on Hamming Pattern Table). Bagian otak manusia akan dibagi terlebih dahulu menjadi enam bagian yang menjadi penyebab AD yakni Entorhinal Cortex (EC), Hippocampus (HIP), Middle Temporal Gyrus (MTG), Posterior Cingulate Cortex (PC), Superior Frontal Gyrus (SFG), dan Visual Cortex (VCX). Algoritma untuk mendapatkan Bicluster pada umumnya hanya dapat digunakan dalam matriks dengan entri bilangan real namun pada penelitian ini akan digunakan algoritma BicHPT yang dapat digunakan untuk mendapatkan bicluster dari matriks yang berisi entri dengan nilai biner yakni 0 dan 1. Data microarray dari Alzheimer disease akan dibinerisasi terlebih dahulu melalui threshold dari mean keseluruhan matriks. Jika nilai suatu entri melebihi nilai threshold maka entri tersebut akan bernilai 1 dan sebaliknya jika entri kurang dari nilai threshold maka entri matriks tersebut akan bernilai 0. Setelah semua entri pada matriks dibinerisasi akan diaplikasikan algoritma BicHPT. Konsep utama algoritma ini adalah mencari jarak Hamming pada masing-masing kolom matriks untuk mendapatkan kandidat bicluster. Algoritma BicHPT terdiri atas beberapa langkah yakni: Mereduksi kolom matriks, mencari tabel dari jarak Hamming, mendapatkan candidat bicluster, dan terakhir diperoleh hasil bicluster dalam bentuk submatriks. Gen dari hasil bicluster yang didapatkan akan dianalisis dengan gene ontology (GO) untuk mengetahui fungsi biologis dari bicluster tersebut. Dengan mendapatkan informasi dari fungsi biologis tersebut melalui algoritma BicHPT diharapkan dapat memberikan potensi dalam analisis diagnosis penyakit Alzheimer di bidang medis.

Alzheimer’s disease is a neurodegenerative disesase or a decline function in neurons which is characterized by severe memory impairment in parts of the brain. In this study we aim to analyze this Alzheimer’s disease (AD) from microarray data to look after a bicluster using BicHPT (Biclustering based on Hamming Pattern Table) algorithm. First we divide the humain brain into six parts that cause the AD, there is Entorhinal Cortex (EC), Hippocampus (HIP), Middle Temporal Gyrus (MTG), Posterior Cingulate Cortex (PC), Superior Frontal Gyrus (SFG), and Visual Cortex (VCX). An algorithm to get a bicluster used only available on real number of matrices. But in this study the BicHPT algorithm can be used to get bicluster from matrices that contain entries with binary number which is 0 or 1. The microarray data from AD will be binarized first through the threshold of the mean from the whole matrices. If the value of an entry exceeds the threshold then the entry will be 1 on the other side if the value of the entry is less than the threshold the matrice will become 0. After all entries in the matrice are binarized, the BicHPT algorithm will be applied. The main concept of this algorithm is to find the Hamming distance in each column to get the bicluster candidates. BicHPT algorithm consist of several steps, which is reducing the matrices column, filling the Hamming distance table, seek for bicluster candidat, and build a bicluster in form of submatrices. Genes from the obtained bicluster will be analyzed by Gene Ontology (GO) to determine the biological function of the bicluster. By that information from these biological functionsthrough the BicHPT algorithm we hope to provide some potential in the analysis of Alzheimer diagnosis in the medical in the future."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rully Soelaiman
"Pengenalan teknologi DNA microarray membuat perolehan data microarray menjadi lebih mudah. Hal ini semakin memicu persoalan tentang bagaimana cara terbaik dalam mengekstraksi dan memilih fitur dari data yang berdimensi besar tersebut. Metode-metode terdahulu mengabaikan adanya hubungan antargen sehingga memungkinkan hilangnya informasi penting yang tersimpan dalam suatu gen pada saat ekstraksi fitur. Meskipun berbagai macam metode telah digunakan, pengembangan metode ekstraksi dan seleksi fitur dari data microarray yang lebih powerful dan efisien masih diperlukan untuk meningkatkan performa klasifikasi kanker. Dalam penelitian ini diimplementasikan sebuah metode dalam melakukan ekstraksi fitur dari data microarray yang memanfaatkan model klasifikasi berbasis informasi pasangan gen, yaitu pasangan gen yang memiliki perbedaan signifikan pada dua jenis sampel tissue. Hasil uji coba terhadap dua data microarray menunjukkan bahwa fitur hasil ekstraksi menggunakan metode ini dapat meningkatkan performa klasifikasi. Bahkan akurasi 100% dapat diperoleh pada uji coba terhadap data lymphoma."
Surabaya: Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember, 2009
AJ-Pdf
Artikel Jurnal  Universitas Indonesia Library
cover
Rosalia Deviana Cahyaningrum
"Penelitian ini bertujuan untuk mengimplementasikan spectral clustering-PAM dengan menggunakan algoritma similaritas serial dan mengimplementasikan algoritma similaritas paralel berbasis CUDA dalam metode spectral clustering pada data microarray gen karsinoma. Implementasi dibantu dengan perangkat lunak R berbasis open source yang digunakan pada algoritma spectral clustering-PAM dengan algoritma similaritas serial dan CUDA yang digunakan pada algoritma similaritas paralel. Pengelompokan data microarray gen karsinoma diawali dengan menormalisasi data menggunakan normalisasi min-max. Pada algoritma spectral clustering-PAM, pertama-tama similaritas antar gen karsinoma dihitung. Selanjutnya, membentuk matriks Laplacian ternormalisasi dari matriks diagonal dan matriks Laplacian tak ternormalisasi. Langkah berikutnya yaitu menghitung eigenvalue dari matriks Laplacian ternormalisasi dan menentukan eigenvector dari eigenvalue terkecil matriks Laplacian ternormalisasi yang disusun menjadi dataset baru untuk dipartisi setiap barisnya menggunakan metode PAM. Berdasarkan running time, waktu yang dibutuhkan untuk menghitung nilai similaritas secara paralel di CUDA 378 kali lebih cepat daripada secara serial di R. Hasil penelitian menunjukkan bahwa spectral clustering-PAM mengelompokkan data microarray gen karsinoma menjadi dua cluster dengan nilai rata-rata silhouette yaitu 0,6458276.

This research aims to implement the spectral clustering PAM using serial similarity algorithm and implement parallel similarity algorithm based on CUDA in spectral clustering method on microarray data of carcinoma genes. Implementation assisted with software based on open source R used in spectral clustering algorithm PAM with serial similarity algorithm and CUDA used to parallel similarity algorithm. Clustering microarray data of carcinoma genes preceded by normalizing the data using min max normalization. In the spectral clustering PAM algorithm, first of all, similarity between genes of carcinoma calculated. Furthermore, forming the normalized Laplacian matrix from diagonal matrix and unnormalized Laplacian matrix. The next step is to calculate the eigenvalues of normalized Laplacian matrix and determine the eigenvectors of k smallest eigenvalues of normalized Laplacian matrix is organized into a new dataset to be partitioned each line using PAM. Based on the running time, the time required to calculate the value of parallel similarity in CUDA is 378 times faster than a serial in R. The results showed that spectral clustering PAM classify microarray data of carcinoma genes into two clusters with an average silhouette value is 0,6458276."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47172
UI - Tesis Membership  Universitas Indonesia Library
cover
Syamira Merina
"Adenoma merupakan jenis tumor jinak pada lapisan epidermis jaringan. Adenoma dapat berubah menjadi kanker ganas yang kemudian disebut Adenocarcinoma. Terdapat salah satu bentuk data biologi molekuler yang sedang berkembang saat ini, yaitu data ekspresi gen microarray. Microarray dapat digunakan untuk pendeteksian dan penelitian dalam bidang onkologi. Salah satu metode untuk mengolah dan menganalisis data ekspresi gen microarray adalah dengan biclustering. Dalam skripsi ini akan dilakukan implementasi salah satu metode biclustering pada data ekspresi gen microarray, yaitu dengan algoritma Binary Inclusion-Maximal. Algoritma akan diimplementasi pada data Adenoma kolon yang terdiri dari 7070 gen dengan 4 sampel sel adenoma dan 4 sampel sel normal. Implementasi tersebut membutuhkan waktu kurang dari 1 detik dan menghasilkan 22 bicluster yang terdiri dari 25 gen secara keseluruhan.

Adenoma is a benign type of tumor in the epidermal layer of a tissue. Adenoma can turn into a malignant cancer which is then called Adenocarcinoma. There is a form of molecular biology data which is developing today, namely microarray gene expression data. Microarray can be use for detection and research in the field of oncology. One method for processing and analyzing microarray gene data is by biclustering. In this study the writer will be using one method of biclustering, the Binary Inclusion Maximal algorithm, and implement it on microarray gene expression data. The algorithm will be implemented on Colon Adenoma data consisting of 7070 genes with 4 adenoma cell samples and 4 normal cell samples. The implementation took less than one second and resulted in 22 biclusters composed of 25 genes.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nurul Hanifah
"Diagnosis kanker payudara umum menggunakan data morfologi dan infomasi klinis. Akan tetapi diagnosis kanker yang akurat dibutuhkan untuk menangani dan terapi yang tepat. Deteksi ekspresi gen merupakan cara yang dapat digunakan untuk menganalisis kanker hingga tingkat molekuler. Microarray adalah teknologi yang memungkinkan analisis ribuan ekspresi gen dalam waktu yang bersamaan. Pembelajaran mesin dapat digunakan untuk menganalisis pola pada microarray dataset. Model pembelajan dengan deep learning, seperti deep stacking network DSN diperlukan untuk data yang kompleks seperti pada microarray. DSN pertama kali diusulkan untuk mengatasi kekurangan dari deep learning pada umumnya. Selain itu dikarenakan tingginya dimensi data microarray, sebelum melalui proses pembelajaran diperlukan reduksi dimensi pada data microarray. Reduksi data menggunakan gene shaving, dimana data akan dikelompokan menjadi beberapa cluster dan juga dengan PCA. Selanjutnya data yang sudah direduksi melalui proses pembelajaran pada model DSN yang terdiri dari 2-layer, 3-layer dan 4-layer dengan laju pembelajaran 0.01, 0.1 dan 1.0. Parameter yang diukur adalah nilai akurasi, mean square error MSE dan waktu eksekusi, dimana nilai terbaik didapatkan pada DSN 2-layer dengan laju pembelajaran 1.0 pada data hasil reduksi PCA.

The diagnosis of breast cancer uses morphological data and clinical information. However, an accurate cancer diagnosis is necessary for the proper treatment. Gene expression detection is a way that can be used to analyze cancer to the molecular level. Microarray is a technology that allows the analysis of thousands of gene expression at the same time. Machine learning can be used to analyze patterns in the microarray dataset. Machine learning with deep architecture deep learning, such as deep stacking learning DSN, is needed for complex data such as microarray. DSN was proposed to overcome the shortage of deep learning. In addition, due to the high dimension of microarray data, dimension reduction in microarray data is required before going through the learning process. Data reduction uses gene shaving, where data will be grouped into clusters and also PCA. Clusters found through the process of gene shaving is a cluster that carries important genetic information in cancer cells so that the gene can represent all data. Furthermore, the data has been reduced going through the learning process on the DSN model consisting of 2 layer, 3 layer and 4 layer with the learning rate of 0.01, 0.1 and 1.0. The parameters measured are the accuracy, mean square error MSE and execution time, which the best value is obtained on 2 layer DSN with learning rate 1.0 on data from the reduction of PCA."
Depok: Fakultas Teknik Universitas Indonesia, 2018
T50170
UI - Tesis Membership  Universitas Indonesia Library
cover
Moh. Abdul Latief
"

Human Immunodeficiency Virus-1 (HIV-1) merupakan virus yang merusak sel CD4+ dalam imun tubuh sehingga menyebabkan sistem kekebalan tubuh menurun drastis. Analisis data ekspresi gen HIV-1 sangat dibutuhkan. Teknologi yang digunakan untuk menganalisis data ekspresi gen yaitu microarray. Teknologi microarray digunakan untuk mengukur nilai ekspresi dari ribuan gen diberbagai macam kondisi. Clustering merupakan teknik untuk memperlajari pola data ekspresi gen kelompok observasi yang memiliki kemiripan berdasarkan kriteria tertentu. Clustering menemukan kelompok observasi pada semua atribut. Untuk menemukan kelompok observasi pada beberapa atribut digunakan analisis biclustering. Dalam data ekspesi gen series yang dibentuk dalam tiga dimensi, analisis yang digunakan adalah triclustering. Pendekatan yang dilakukan dalam membangun triclustering yaitu pendekatan biclustering melalui teknik pencarian bicluster menggunakan Multi-Objective Evolutionary Algorithm (MOEA). Metode evaluasi yang digunakan MOEA adalah Mean Square Residue (MSR) dan kebaruan dalam penelitian ini adalah memodifikasi MOEA dengan metode evaluasi Transpose Virtual Error yang mendeteksi pergeseran (shifting) dan penskalaan (scaling) sekaligus. Hasil dari bicluster terbaik digunakan sebagai input dalam THD-Tricluster. Data tricluster yang diperoleh mengandung probe ID-gen 208812_x_at, 209602_s_at, dan 201465_s_at dengan nama gen HLA-C, GATA-3 dan JUN yang berhubungan dengan HIV-1.

 


Human Immunodeficiency Virus-1 (HIV-1) is a virus that kills CD4 + cells in the bodys immune system, causing a drastic decline in the immune system. Analysis of HIV-1 gene expression data is urgently needed. The technology used to analyze gene expression data is microarray. Microarray technology is used to measure the expression value of thousands of genes in various conditions. Clustering is a technique for studying the gene expression data patterns of the observation groups that are similar based on certain criteria. Clustering finds groups of observations on all attributes. Biclustering analysis is used to find the group of observations on several attributes. In the gene expression series data which is formed in three dimensions, the analysis used is triclustering. The approach taken in building triclustering is the biclustering approach through the bicluster search technique using the Multi-Objective Evolutionary Algorithm (MOEA). The evaluation method used by MOEA is Mean Square Residue (MSR) and the novelty in this study is to modify the MOEA with the Transpose Virtual Error evaluation method which detects shifting and scaling at the same time. The results from the best bicluster are used as input in the THD-Tricluster. The tricluster data obtained contained the gene ID probes 208812xat, 209602s_at, and 201465sat with the gene names HLA-C, GATA-3 and JUN associated with HIV-1.

 

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Adib Hanafi
"Teknologi microarray merupakan salah satu teknologi yang berkembang dalam bidang bioinformatika. Salah satu teknologi microarray dalam bidang kesehatan, yaitu untuk mendeteksi adanya gen pada DNA individu yang menghasilkan data ekspresi gen. Pada data ekspresi gen, sering kali ditemukan informasi yang hilang sehingga membuat terhambatnya analisis lebih lanjut pada data ekspresi gen. Pada penelitian ini, diusulkan metode imputasi missing values Sequential Biclustering berbasis Shifting-and-Scaling Similarity dan Mean Square Residue (SSSim-MSR). Penentuan anggota bicluster dengan kesamaan sifat co-expressed dan pendeteksian pola shifting-and-scaling dilakukan berdasarkan pada skor Mean Squared Residue (MSR) dan skor Shifting-and-Scaling Similarity (SSSim) antara masing-masing gen dengan gen yang mengandung missing values. Performa metode diukur dengan skor korelasi Pearson dan skor NRMSE, lalu dibandingkan dengan metode Chronological Biclustering berbasis PCor-MSRE. Berdasarkan pada skor korelasi Pearson, metode Sequential Biclustering dengan basis SSSim-MSR merupakan metode yang cukup baik dibandingkan metode Chronological Biclustering berbasis PCor-MSRE pada missing rate sebesar 20% dan 50% untuk setiap nilai k. Untuk setiap missing rate pada nilai k lainnya, skor korelasi Pearson yang dihasilkan belum tentu bernilai lebih besar untuk nilai k yang lebih besar. Hal ini dapat terjadi karena perseberan porporsi pola shifting-and-scaling dan yang tidak berpola shifting-and-scaling pada data yang digunakan cenderung sama, sehingga pada tahap pembentukan bicluster yang didasarkan pada keserupaan pola dan pendeteksian pola shifting-and-scaling dapat memengaruhi keserupaan pola yang dibentuk.

Microarray technology is one of the emerging technologies in the field of bioinformatics. One of the microarray technologies in the health sector is to detect the presence of genes in individual DNA that produce gene expression data. In gene expression data, missing information is often found, which hinders further analysis of gene expression data. In this study, a method of imputing missing values Sequential Biclustering based on Shifting-and-Scaling Similarity and Mean Square Residue (SSSim - MSR) is proposed. Determination of bicluster members with similar co-expressed characteristics and detection of shifting-and-scaling patterns is carried out based on the score. Mean Squared Residue (MSR) and Shifting-and-Scaling Similarity (SSSim) scores between each gene and genes containing missing values. The performance of the method was measured by the Pearson correlation score and the NRMSE score, then compared with the Chronological Biclustering method on the basis of PCor – MSRE. Based on the Pearson correlation score, the Sequential Biclustering method on the basis of SSSim – MSR is a fairly good method compared to the Chronological Biclustering method at a missing rate of 20% and 50% for each value of k. For each other missing rate for k values, the resulting Pearson correlation score is not necessarily greater for larger k values. This can happen because the proportions of shifting-and-scaling and non-shifting-and-scaling patterns in the data used tend to be the same, so that at the stage of bicluster formation based on pattern similarity and detection of shifting-and-scaling patterns can detect similarity of pattern."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Adinda Dwi Putri
"Bioinformatika kerap digunakan oleh para peneliti untuk mempelajari berbagai penyakit yang ada pada tubuh manusia, salah satunya yaitu kanker payudara. Penelitian terhadap kanker payudara tersebut dilakukan dengan tujuan untuk menemukan jenis pengobatan terbaik bagi para pasien penderita kanker payudara. Data ekspresi gen merupakan salah satu komponen utama dalam penelitian mengenai pengobatan kanker payudara dan data tersebut dapat diperoleh dengan menggunakan alat dan teknologi microarray. Akan tetapi, seringkali ditemukan beberapa nilai yang hilang (missing values) pada data ekspresi gen yang dapat disebabkan oleh kesalahan teknis seperti kerusakan pada chip dan gambar. Adanya missing values juga dapat mengakibatkan masalah ketika proses analisis data selanjutnya, dimana terdapat metode analisis data yang memerlukan data lengkap seperti klasifikasi dan clustering. Oleh sebab itu, perlu dilakukan proses imputasi terhadap missing values agar hasil analisis data yang diperoleh lebih akurat. Pada penelitian ini, metode imputasi missing values yang digunakan yaitu SBi-MSREimpute. SBi-MSREimpute adalah metode imputasi berbasis biclustering dimana bicluster dibentuk berdasarkan suatu kriteria yang melibatkan skor Mean Squared Residue dan jarak Euclidean. Metode SBi-MSREimpute diimplementasikan pada data ekspresi gen pasien penderita kanker payudara stadium awal yang telah diberikan jenis obat MK-2206. Kinerja metode SBi-MSREimpute dilihat dengan membandingkan hasil imputasi metode SBi-MSREimpute dengan metode imputasi lain yaitu metode imputasi menggunakan weighted average berdasarkan skor Normalized Root-Mean-Square-Error (NRMSE). Hasil evaluasi dengan skor NRMSE tersebut menunjukkan bahwa kinerja metode SBi-MSREimpute dapat dipengaruhi oleh penentuan nilai k yang ada pada metode SBi-MSREimpute.

Bioinformatics is often used by researchers to study various diseases that exist in the human body, one of which is breast cancer. The research on breast cancer was conducted with the aim of finding the best type of treatment for breast cancer patients. Gene expression data is one of the main components in research on breast cancer treatment and this data can be obtained using microarray tools and technology. However, there are often missing values found in gene expression data that can be caused by technical errors such as damage to chips and images. The existence of missing values ​​can also cause problems during the data analysis process, where there are data analysis methods that require complete data such as classification and clustering. Therefore, it is necessary to carry out an imputation process for missing values ​​so that the data analysis results obtained are more accurate. In this study, the missing values ​​imputation method used was SBi-MSREimpute. SBi-MSREimpute is a biclustering-based imputation method where the bicluster is formed based on a criterion involving Mean Squared Residue and Euclidean Distance. In this study, the SBi-MSREimpute method was applied to the gene expression data of patients with early stage breast cancer who had been given the MK-2206 type of drug. The performance of the SBi-MSREimpute method is assessed by comparing the results of the imputation using SBi-MSREimpute method with other imputation methods, namely the imputation method using weighted average, based on the Normalized Root-Mean-Square-Error score (NRMSE). The results of the evaluation with NRMSE score showed that the performance of the SBi-MSREimpute method can be affected by the determination of k value in the SBi-MSREimpute method."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Silvia
"Teknologi microarray merupakan analisis terhadap tingkat ekspresi puluhan ribu gen secara paralel untuk melihat perbedaan ekspresi gen. Penelitian microarray menghasilkan suatu nilai yang dirangkum dalam sebuah data yang disebut sebagai data ekspresi gen. Data ekspresi gen umumnya memiliki ukuran yang besar dan penggunaannya luas. Akan tetapi, data ekspresi gen sering mengalami masalah missing values. Data ekspresi gen umumnya mengandung persentase missing values sebesar 10% atau bahkan hingga 90% gen memiliki satu hingga lebih missing values. Salah satu solusi untuk mengatasi adanya missing values adalah dengan menggunakan teknik imputasi.  Pada penelitian ini, diajukan metode imputasi missing values Chronological Biclustering dengan basis PCor-MSRE yang berdasarkan pada konsep biclustering. Penentuan anggota bicluster dengan kesamaan sifat co-expressed dan ukuran magnitude dilakukan berdasarkan pada skor Mean Squared Residue (MSR), jarak Euclidean, dan ukuran jarak korelasi Pearson antara masing-masing gen dengan gen yang mengandung missing values. Dilakukan perhitungan skor MSR, jarak Euclidean, dan ukuran jarak korelasi Pearson pada setiap gen, kemudian dipilih k gen yang memberikan skor terkecil untuk masing-masing kriteria. Selanjutnya, dibentuk bicluster yang digunakan untuk mengimputasi nilai observasi yang missing. Metode ini merupakan pengembangan dari metode SBi-MSREimpute yang cocok digunakan pada data ekspresi gen non-time series atau time series. Metode diimplementasikan pada data ekspresi gen lengkapnon-time series GSE142693 mengenai sel tumor 12 pasien Glioblastoma. Pada data GSE142693, dilakukan konstruksi missing values MCAR dengan missing rate sebesar 5%, 10%, 20%, 30%, 40%, 50%, dan 60%. Performa metode diukur dengan skor NRMSE dan korelasi Pearson, kemudian dibandingkan dengan metode SBi-MSREimpute. Berdasarkan pada skor korelasi Pearson, metode Chronological Biclustering dengan basis PCor-MSRE merupakan metode yang cukup baik dibanding SBi-MSREimpute dalam mengimputasi missing values pada data GSE142693 jika missing rate-nya cukup besar (40%, 50% dan 60%) dengan penggunaan nilai yaitu  dan. Untuk nilai k yang lebih kecil dari 25, metode Chronological Biclustering dengan basis PCor-MSRE cukup baik digunakan (dibanding SBi-MSREimpute) jika jumlah observasi yang missing sebanyak 50% dan 60%. Performa metode Chronological Biclustering dengan basis PCor-MSRE semakin baik seiring dengan membesarnya nilai k yang digunakan. Artinya, performa metode Chronological Biclustering dengan basis PCor-MSRE dapat dipengaruhi oleh penentuan nilai k di awal.

Microarray technology is an analysis of the expression levels of tens of thousands of genes in parallel to see differences in gene expression. Microarray research produces a value that is summarized in a data called gene expression data. Gene expression data are generally large in size and widely used. However, gene expression data often suffer from missing values problems. Gene expression data generally contain a percentage of missing values of 10% or even up to 90% of genes having one or more missing values. One solution to overcome the missing values is to use the imputation technique. In this research, the method of imputing missing values Chronological Biclustering is proposed on the PCor - MSRE basis which is based on the biclustering concept. Determination of bicluster members with similar co-expressed traits and magnitude measures was carried out based on the Mean Squared Residue (MSR) score, the Euclidean distance, and the measure of the Pearson correlation distance between each gene and the gene containing missing values. The MSR score, Euclidean distance, and Pearson correlation distance measures were calculated for each gene, then k genes were selected that gave the smallest score for each criterion. Next, a bicluster is formed which is used to impute the missing observation values. This method is a development of the SBi-MSRE impute method which is suitable for use in non-time series or time series gene expression data. The method was implemented on the complete non-time series gene expression data GSE142693 regarding tumor cells of 12 Glioblastoma patients. In the GSE142693 data, MCAR missing values were constructed with a missing rate of 5%, 10%, 20%, 30%, 40%, 50%, and 60%. The performance of the method was measured by the NRMSE score and Pearson correlation, then compared with the SBi-MSREimpute method. Based on the Pearson correlation score, the Chronological Biclustering method with PCor - MSRE basis is a method that is quite good compared to SBi-MSRE impute in imputing missing values in GSE142693 data if the missing rate is large enough (40%, 50% and 60%) with the use of namely k=25,k=45,k=65,k=105,k=335, and k=375. For k values less than 25, the Chronological Biclustering method on the basis of PCor - MSRE is quite good to use (compared to SBi-MSRE impute) if the number of missing observations are 50% and 60%. The performance of the Chronological Biclustering method on the PCor - MSRE basis is getting better as the value of k used increases. This means that the performance of the Chronological Biclustering method on the PCor-MSRE basis can be affected by determining the initial k value."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4   >>