Hasil Pencarian

Ditemukan 149609 dokumen yang sesuai dengan query

Muhamad Ido Raskapati

Analisis Triclustering menggunakan Metode Gabungan Fuzzy Cuckoo Search Berdasarkan Gaussian Distribution dengan δ-Trimax pada Data Ekspresi Gen = Analysis of Triclustering using Combined Method of Fuzzy Cuckoo Search Based on Gaussian Distribution and ð¿-Trimax on Gene Expression Data

"Analisis triclustering adalah salah satu metode data mining yang memiliki tujuan mengelompokkan data berbentuk tiga dimensi. Triclustering umumnya digunakan pada bidang bioinformatika untuk menganalisis kesamaan ekspresi gen suatu eksperimen pada titik waktu tertentu. Analisis triclustering yang dilakukan pada penelitian ini menggunakan metode gabungan Fuzzy Cuckoo Search berdasarkan Gaussian Distribution dengan -Trimax. Metode ini merupakan penggabungan algoritma nodes deletion pada Trimax dengan algoritma optimasi Fuzzy Cuckoo Search. Algoritma nodes deletion pada -Trimax digunakan pada fase pembentukan populasi awal tricluster. Konsep algoritma nodes deletion yaitu dapat menghasilkan himpunan tricluster dengan Mean Square Residue (MSR) di bawah threshold dan mendekati 0. Algoritma optimasi Cuckoo Search adalah algoritma pencarian solusi tricluster, digambarkan dengan konsep parasitisme spesies burung cuckoo. Pada penelitian ini, Cuckoo Search menggunakan random walk Gaussian Distribution untuk pencarian solusi tricluster. Berdasarkan hal ini komputasi algoritma Cuckoo Search menjadi lebih efisien dan efektif dalam menghasilkan himpunan tricluster yang lebih optimal dan mempercepat waktu komputasi. Fuzzy Cuckoo Search adalah pengembangan dari Cuckoo Search yang menggunakan fungsi objektif Fuzzy C-Means untuk mengatasi ketidakjelasan (uncertainty) dalam data ekspresi gen. Analisis triclustering menggunakan metode gabungan Fuzzy Cuckoo Search berdasarkan Gaussian Distribution dengan -Trimax digunakan pada data ekspresi gen tiga dimensi sel fibroblas yang diberikan perlakuan dengan Egr-1 dan Tgf-, di mana ekspresi gen diamati pada 6 kondisi dan 2 titik waktu. Pada penelitian ini, himpunan tricluster yang memiliki kualitas terbaik berdasarkan Triclustering Quality Index adalah himpunan tricluster yang dihasilkan dengan nilai = 0,015 dan = 0,50 . Berdasarkan himpunan tricluster tersebut, didapatkan informasi penting mengenai kumpulan gen yang memiliki respon baik terhadap pemberian perlakuan dengan Egr-1, Tgf- dan bertahan setiap titik waktu. Kumpulan gen tersebut dilakukan Gene Ontology (GO) yang diuji menggunakan Fisher’s exact dengan tingkat signifikansi 0,05 dan dikoreksi dengan False Discovery Rate. Hasil GO tersebut terdiri dari 219 GO Terms Biological Process, 28 GO Terms Molecular Function, dan 52 GO Terms Cellular Component. GO Terms dari masing-masing aspek GO tersebut dapat dijadikan bahan untuk penelitian di bidang bioinformatika untuk menganalisis hubungan GO Terms terhadap penyakit Systemic Sclerosis (SSc).

Triclustering analysis is one of the data mining methods aimed at clustering threedimensional data. Triclustering is commonly used in the field of bioinformatics to analyze the similarity of gene expression in an experiment at specific time points. The triclustering analysis in this research uses a combined method of Fuzzy Cuckoo Search based on Gaussian Distribution with -Trimax. This method combines the nodes deletion algorithm of -Trimax with the optimization algorithm of Fuzzy Cuckoo Search. The nodes deletion algorithm of -Trimax is used in the initial population formation phase of the tricluster. The concept of the nodes deletion algorithm is to produce tricluster sets with Mean Square Residue (MSR) below the threshold and close to 0. The optimization algorithm of Cuckoo Search is a search algorithm for tricluster solutions, depicted with the parasitism concept of cuckoo bird species. In this research, Cuckoo Search uses random walk Gaussian Distribution for tricluster solution search. This enhances the efficiency and effectiveness of the Cuckoo Search algorithm in producing more optimal tricluster sets and accelerating the computation time. Fuzzy Cuckoo Search is an extension of Cuckoo Search that employs Fuzzy C-Means objective function to handle uncertainty in gene expression data. The triclustering analysis using the combined method of Fuzzy Cuckoo Search based on Gaussian Distribution with -Trimax is applied to the three-dimensional gene expression data of fibroblast cells treated with Egr-1 and Tgf-1, where gene expressions are observed under 6 conditions and 2 time points. In this research, the tricluster set with the best quality based on the Triclustering Quality Index (TQI) is obtained with = 0.015 and = 0.50. Based on this tricluster set, important information is derived regarding groups of genes that respond well to treatment with Egr1, Tgf, and persist at each time point. These gene groups are subjected to Gene Ontology (GO) analysis, which is tested using Fisher's exact test with a significance level of 0.05 and corrected with False Discovery Rate. The GO results consist of 219 GO Terms Biological Process, 28 GO Terms Molecular Function, and 52 GO Terms Cellular Component. The GO Terms from each aspect can be utilized for further research in the field of bioinformatics to analyze the relationship of GO Terms with Systemic Sclerosis (SSc) disease."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Akira Andriani

Implementasi Triclustering Menggunakan Metode Fuzzy Cuckoo Search berdasarkan Distribusi Gaussian pada Data Ekspresi Gen = The Implementation of Triclustering using Fuzzy Cuckoo Search Based on Gaussian Distribution on Gene Expression Data

"Analisis clustering merupakan proses pengelompokan yang bertujuan untuk menemukan kelompok atau cluster yang didalamnya memiliki karakteristik yang serupa. Seiring berjalannya waktu, teknik clustering berkembang menjadi biclustering dan triclustering, di mana dalam triclustering data yang digunakan adalah data tiga dimensi. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara bersamaan yang nantinya kelompok yang dihasilkan disebut dengan tricluster. Pada penelitian ini, digunakan metode Fuzzy Cuckoo Search (FCS) untuk mengimplementasikan triclustering pada data ekspresi gen tiga dimensi. FCS mengaplikasikan konsep Fuzzy C-Means (FCM) ke dalam algoritma cuckoo search. Penggunaan fungsi objektif FCM dalam FCS dapat mengatasi ketidakjelasan (uncertainty) dalam data, khususnya pada data ekspresi gen. Dalam metode cuckoo search, pencarian ‘solusi’ tricluster digambarkan dengan spesies cuckoo yang meletakkan telur di sarang burung lain. Berbeda dengan cuckoo search pada umumnya yang menggunakan metode random walk levy flight untuk pencarian solusi, pada penelitian ini, digunakan metode lain, yaitu metode random walk distribusi gaussian, di mana hal tersebut merupakan sebuah kebaruan dalam penelitian ini. Cuckoo search dalam metode FCS merupakan metode metaheuristik, sehingga dapat digunakan dalam berbagai masalah analisis data, termasuk data ekspresi gen. Metode FCS berdasarkan distribusi gaussian diimplementasikan pada data ekspresi gen tiga dimensi dari gen otot rangka yang diberi infus IL-6, di mana ekspresi gen diamati pada 3 subjek dan 3 titik waktu yang berbeda. Metode ini dievaluasi menggunakan ukuran evaluasi Triclustering Quality Index (TQI). Dari skenario yang dilakukan, metode FCS memberikan hasil terbaik dengan rata-rata TQI terendah ketika menggunakan nilai gaussian dan probabilitas . Hasil implementasi metode FCS menunjukkan 4 tricluster yang diduga sebagai kumpulan gen yang berekspresi atas respon dari IL-6. Kelompok gen yang diperoleh dari tricluster dapat digunakan sebagai target oleh ahli medis dalam pengembangan di bidang pengobatan penyakit seperti kanker, diabetes, paru-paru, atau gagal jantung yang menargetkan gen-gen dalam kelompok tricluster tersebut.

Clustering analysis is a grouping process that aims to find clusters such that objects in the same clusters have similar characteristics. Over time, clustering developed into biclustering and triclustering, wherein triclustering use three-dimensional dataset. Triclustering is able to group these three dimensions simultaneously and form groups called tricluster. This study used the Fuzzy Cuckoo Search (FCS) method to implement triclustering on three-dimensional gene expression data. FCS applies the Fuzzy C-means (FCM) concept to the cuckoo search algorithm. The use of the objective function of FCM in FCS can overcome the uncertainty in the data, especially in gene expression data. In the cuckoo search, finding the tricluster is described with cuckoo species laying their egg in the nests of other birds. The egg laid on the nest represents a 'solution' which is an update of the tricluster from the previous tricluster. Unlike cuckoo search in general, in this study, to find the tricluster solutions, it use gaussian random walk instead of levy flight random walk. Cuckoo search in the FCS method is a metaheuristic method, so it can be used in various data analysis problems, including gene expression data. FCS based on Gaussian distribution was implemented on three-dimensional gene expression data of skeletal muscle genes given IL-6 infusion, where the gene expression was observed in 3 subjects and 3 different time points. Of the 36 simulations performed, the FCS method gives the best results with the lowest average TQI when using gaussian values and probability . This method was evaluated using the Triclustering Quality Index (TQI) evaluation measure. The result of the implementation of FCS shows 4 triclusters which were suspected to be a collection of genes that change in response to IL-6. The gene groups obtained from the tricluster can be used as a consideration by medical professionals in the development of the treatment of diseases such as cancer, diabetes, pulmonary disease, or heart failure that target the genes in the tricluster group."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Airlangga Muhammad Putrapradana

Analisis Triclustering Menggunakan Metode Gabungan Fuzzy Cuckoo Search dengan δ-Trimax pada Data Ekspresi Gen Tiga Dimensi = Triclustering Analysis Using Hybrid Fuzzy Cuckoo Search with Î´-Trimax Method on Three Dimensional Gene Expression Data

"Analisis triclustering merupakan salah satu metode data mining yang bertujuan mengelompokkan data berbentuk tiga dimensi. Triclustering kerap digunakan pada bidang bioinformatika untuk menganalisis kesamaan ekspresi gen suatu eksperimen pada titik waktu tertentu. Analisis triclustering yang dilakukan pada penelitian ini menggunakan metode gabungan Fuzzy Cuckoo Search dengan I-Trimax. Metode ini merupakan penggabungan algoritma nodes deletion pada I-Trimax dengan algoritma optimasi Fuzzy Cuckoo Search. Cuckoo Search merupakan metode optimasi yang sudah baik dalam menghasilkan himpunan tricluster yang menggunakan konsep parasitisme spesies cuckoo. Fuzzy Cuckoo Search menggunakan fungsi objektif fuzzy c-means untuk mengatasi ketidakjelasan (indiscernibility) yang biasa terjadi dalam data ekspresi gen sehingga masalah kesulitan membedakan objek karena kurangnya pengetahuan dari informasi yang tersedia dapat diatasi. Algoritma nodes deletion pada I-Trimax digunakan pada fase pembentukan populasi awal dari metode gabungan Fuzzy Cuckoo Search dengan I-Trimax. Hal ini dilakukan demi mendapatkan populasi awal yang sudah baik yaitu memiliki MSR yang minimum karena konsep dari algoritma nodes deletion yaitu dapat menghasilkan himpunan tricluster dengan Mean Square Residue (MSR) kecil yaitu di bawah threshold. Berdasarkan itu proses komputasi algoritma Fuzzy Cuckoo Searchyang dilakukan pada fase optimasi dapat berjalan dengan efektif sehingga menghasilkan himpunan tricluster yang berkualitas baik secara efisien. Analisis triclustering menggunakan metode gabungan Fuzzy Cuckoo Search dengan I-Trimax digunakan pada data ekspresi gen tiga dimensi sel kanker paru-paru fase stabil (A549) yang berkaitan dengan pemberian obat kemoterapi Motexafin Gadolinium (MGd), di mana ekspresi gen diamati pada 6 kondisi dan 3 titik waktu. Pada penelitian ini, himpunan tricluster yang memiliki kualitas terbaik berdasarkan Triclustering Quality Index (TQI) adalah himpunan tricluster yang dihasilkan dengan nilai dan. Berdasarkan himpunan tricluster tersebut, didapatkan informasi penting mengenai kumpulan gen yang memiliki respon baik terhadap pemberian MGd tapi tidak bertahan setiap titik waktu. Hal ini dapat dijadikan acuan penelitian terkait terapi kanker menggunakan obat kemoterapi MGd yang perlu dilakukan pengembangan agar dapat tetap efektif pada seluruh titik waktu. Terdapat juga kumpulan gen yang memiliki respon cepat dan bertahan hingga jangka panjang dengan pemberian MGd dan mannitol. Gen-gen tersebut merupakan gen yang menunjukkan respon baik pemberian obat kemoterapi MGd tetapi efektivitasnya tidak terlalu maksimal karena responnya beririsan dengan subjek yang hanya diberikan mannitol. Hal ini dapat dijadikan bahan untuk penelitian lebih lanjut dalam pengembangan obat MGd supaya dapat lebih efektif.

Triclustering analysis is a data mining method that aims to group data in three dimensions. Triclustering is often used in the field of bioinformatics to analyze the similarity of gene expression under experimental conditions at a certain point in time. The triclustering analysis carried out in this study used the combined Fuzzy Cuckoo Search method with -Trimax. This method is a combination of node deletion algorithm on -Trimax with Fuzzy Cuckoo Search optimization algorithm. Cuckoo Search is a good optimization method in generating tricluster sets that use the concept of parasitism of cuckoo species. Fuzzy Cuckoo Search uses the fuzzy c-means objective function to overcome the indiscernibility that usually occurs in gene expression data so that the problem of difficulty distinguishing objects due to lack of knowledge from available information can be overcome. The nodes deletion algorithm on I-Trimax is used in the initial population formation phase from the combined Fuzzy Cuckoo Search method with I-Trimax. This is done in order to get a good initial population, which has a minimum MSR because the concept of the nodes deletion algorithm is that it can produce a tricluster set with a small Mean Square Residue (MSR), which is below the threshold. Based on that, the computational process of the Fuzzy Cuckoo Search algorithm which is carried out in the optimization phase can run effectively so as to produce a good quality tricluster set efficiently. Triclustering analysis using the combined Fuzzy Cuckoo Search method with I-Trimax was used on three-dimensional gene expression data of stable phase lung cancer cells (A549) associated with the administration of the chemotherapy drug Motexafin Gadolinium (MGd), where gene expression was observed in 6 conditions and 3 time points. In this study, the tricluster set that has the best quality based on the Triclustering Quality Index (TQI) is the resulting tricluster set with values. Based on these tricluster sets, important information was obtained regarding gene pools that responded well to MGd administration but did not persist at any point in time. This can be used as a reference for research related to cancer therapy using MGd chemotherapy drugs that need to be developed in order to remain effective at all time points. There is also a gene pool that responds quickly and persists in the long term with MGd and mannitol administration. These genes are genes that show a good response to MGd chemotherapy drugs but their effectiveness is not maximal because their responses coincide with subjects who are only given mannitol. This can be used as material for further research in the development of MGd drugs so that they can be more effective."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Nisa Nurul Hidayah

Triclustering Optimal pada Data Ekspresi Gen Penyakit Jantung dengan Menggunakan Metode Triclustering Gabungan Delta-Trimax dengan Fuzzy Cuckoo Search berdasarkan Levy Flight = Optimal Triclustering of Heart Disease Gene Expression Data Using Hybrid Triclustering Method Delta-Trimax with Fuzzy Cuckoo Search Levy

"Triclustering digunakan untuk mengelompokkan data tiga dimensi secara simultan. Metode triclustering yang digunakan pada penelitian ini adalah gabungan ð¿-Trimax dengan Fuzzy Cuckoo search (FCS) berdasarkan LÃ©vy Flight. Data yang digunakan adalah data ekspresi gen dari proses diferensiasi human induced pluripoten stem cell (HiPSC) pada penderita penyakit jantung. Tahap awal adalah mencari populasi solusi tricluster homogen menggunakan metode ð¿-Trimax. Penentuan nilai skala ð¿ untuk menjalankan algoritma pada tahap populasi awal dilakukan menggunakan metode silhouette coefficient. Algoritma ð¿-Trimax yang digunakan pada penelitian ini adalah algoritma Muliple Nodes Deletions dan Single Node Deletions. Tricluster yang didapatkan dari tahap ð¿- Trimax selanjutnya akan dioptimasi menggunakan metode Fuzzy Cuckoo search berdasarkan LÃ©vy Flight. Solusi tricluster yang berpotensi meningkatkan nilai fungsi objektif akan diganti menggunakan local random walk. Kumpulan tricluster yang terbentuk dari tahap optimasi akan dievaluasi menggunakan metode Tricluster Quality Index (TQI). Solusi tricluster terbaik yang diterapkan pada dataset tiga dimensi penyakit jantung didapatkan dari penggunaan nilai skala ð¿ = 0,026 dan ð = 1,7. Solusi tricluster terbaik dianalisis lebih lanjut menggunakan Gene Ontology (GO) untuk menjelaskan keterkaitan gen-gen terhadap proses biologis, fungsi molekuler, dan komponen seluler.

Triclustering is used to group three-dimensional data simultaneously. The triclustering method used in this research is a combination of Î´-Trimax with Fuzzy Cuckoo search (FCS) based on LÃ©vy Flight. The threedimensional data used is gene expression data from the human induced pluripotent stem cell (HiPSC) differentiation process in heart disease sufferers. The initial stage finds a homogeneous population of tricluster solutions using the Î´-Trimax method. Determining the Î´ scale value for running the algorithm at the initial population stage is carried out using the silhouette coefficient method. The Î´-Trimax algorithm used in this research is the Multiple Nodes Deletions and Single Node Deletions algorithms. The tricluster obtained from the Î´-Trimax stage will then be optimized using the Fuzzy Cuckoo search method based on LÃ©vy Flight. The tricluster solution which has the potential to increase the objective function value will be replaced using a local random walk. The tricluster collection formed from the optimization stage will be evaluated using the Tricluster Quality Index (TQI) method. The best tricluster solution applied to a three-dimensional heart disease dataset was obtained from using scale values Î´ = 0,026 and Î¸ = 1,7. The best tricluster solution was further analyzed using Gene Ontology (GO) to explain the relationship of genes to biological processes, molecular functions, and cellular components.
"

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Dea Siska

Analisis triclustering menggunakan algoritma order preserving triclustering (OPTricluster) dan implementasinya pada data ekspresi gen = Analysis of triclustering using order preserving triclustering (OPTricluster) algorithm and its implementation on gene expression data

"Metode triclustering merupakan pengembangan dari metode clustering dan biclustering. Berbeda dengan metode clustering dan biclustering yang bekerja pada data dua dimensi, triclustering bekerja pada data tiga dimensi yang disusun dalam bentuk matriks. Matriks ini terdiri dari dimensi observasi, atribut, dan konteks. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara simultan dan membentuk kelompok berupa subruang yang disebut tricluster. Metode ini umumnya diimplementasikan dalam bidang bioinformatika, terkhususnya dalam analisis data ekspresi gen tiga dimensi untuk menemukan profil ekspresi gen. Data atau matriks ini terdiri dari dimensi gen, kondisi eksperimen, dan waktu eksperimen (time point).

Salah satu algoritma triclustering, yaitu Order Preserving Triclustering (OPTricluster), adalah algoritma yang menggunakan pendekatan pattern based dan digunakan untuk menganalisis data ekspresi gen tiga dimensi yang merupakan short time series 3-8 time point). OPTricluster membentuk tricluster dengan mengidentifikasi gen-gen yang memiliki perubahan ekspresi yang sama di sepanjang time points pada sejumlah kondisi eksperimen.

Dalam penelitian ini, OPTricluster diimplementasikan pada data ekspresi gen sejumlah pasien yellow fever pasca vaksinasi dengan beberapa skenario yang menggunakan threshold yang berbeda-beda. Skenario dengan threshold yang optimum ditunjukkan oleh rata-rata skor Tricluster Diffusion terendah. Tricluster-tricluster yang dihasilkan berhasil menunjukkan hubungan biologis di antara pasien-pasien tersebut, di mana vaksin cenderung memberikan reaksi yang lebih signifikan pada pasien pria dibandingkan pasien wanita. Selain itu, ditemukan anomali pada pasien-pasien tersebut.

Triclustering method is the development of clustering method and biclustering method. Unlike clustering and biclustering that works on two-dimensional data, triclustering works on three-dimensional data that arranged in the form of a matrix consisting of observations, attributes, and contexts dimensions. Triclustering is able to group these dimensions simultaneously and form a subspace called a tricluster. This method is generally implemented in analysis of three-dimensional gene expression data to find profiles of gene expression. This data or matrix consists of genes, experimental conditions and time points dimensions.
One of the triclustering algorithms, Order Preserving Triclustering (OPTricluster), is an algorithm that uses a pattern-based approach and used to analyze short time series data (3-8 time points). The OPTricluster forms the tricluster by identifying genes that have the same expression change across time points under a number of experimental conditions. The change in expression is expressed in a rank pattern which is divided based on three types of patterns, namely constant, conserved and divergent patterns.
In this study, OPTricluster was implemented in gene expression data of yellow fever patients after vaccination using several scenarios with different thresholds. The scenario with the optimum threshold is indicated by the lowest average Tricluster Diffusion score. The resulting triclusters were successful in showing biological relationships among these patients, where the vaccine tending to have a more significant reaction in male patients than in female patients. In addition, anomalies were found in these patients."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Ekawati Marlina

Model Penilaian Kesiapan Research Data Management institusi penelitian di Indonesia = Assessment Model of Research Data Management Readiness for Indonesian Research Institutions

"Data penelitian merupakan output dari kegiatan penelitian dan aset penting bagi institusi penelitian. Research data management (RDM) merupakan aktivitas penyimpanan, akses, dan pelestarian dari data yang dihasilkan dari proyek penelitian. Implementasi RDM di institusi penting dalam mendukung berbagi data dan kolaborasi. Tujuan dari penelitian ini yaitu membangun model penilaian kesiapan RDM. Model yang dapat digunakan untuk membantu institusi penelitian dalam menilai tingkat kesiapan dan mengidentifikasi kesenjangan untuk mengembangkan strategi dalam menerapkan RDM. Model penilaian kesiapan RDM terdiri dari dua komponen, yaitu model kesiapan dan metode penilaian kesiapan. Model kesiapan dibentuk dari sejumlah faktor yang merupakan standar kriteria untuk menyiapkan institusi dalam menerapkan RDM. Kerangka kerja technology, organization, people, dan environment (TOPE) digunakan sebagai panduan dalam memilih faktor dan indikator. Fuzzy Delphi Method digunakan untuk memvalidasi faktor dan indikator yang diturunkan dari literatur. Faktor yang dihasilkan kemudian diintegrasikan dengan faktor yang diperoleh dari hasil wawancara dengan pengelola data penelitian di beberapa institusi penelitian di Indonesia. Setelah dilakukan validasi pakar, hasil akhir dari model kesiapan RDM terdiri dari empat dimensi, 13 faktor dan 42 indikator. Penelitian ini mengungkapkan bahwa lingkungan merupakan faktor kunci dari kesiapan RDM, faktor ini belum dibahas pada penelitian sebelumnya. Komponen kedua dari model penilaian kesiapan RDM yaitu metode penilaian yang terdiri dari pembobotan kriteria, instrumen penilaian, dan klasifikasi level kesiapan. Bobot dari dimensi dan faktor kesiapan ditentukan dengan menggunakan best worst method. Urutan dimensi berdasarkan besaran bobot yaitu technology, people, organization, dan environment. Besaran dari rentang nilai pada level kesiapan diperoleh berdasarkan pendapat dari para pakar. Kategorisasi dari level kesiapan RDM yaitu rendah (0 - 1,55), sedang (1,56 - 3,45), dan tinggi (3,46 - 5.00). Dalam penelitian ini, purwarupa dikembangkan sebagai sarana uji validasi dari model penilaian kesiapan yang dikembangkan. Pengujian black box menunjukkan bahwa fungsionalitas antar muka dari purwarupa berjalan dengan baik. Nilai system usability scale (SUS) sebesar 73,57 mengindikasikan bahwa antar muka dapat diterima. Sepanjang pengetahuan dari peneliti, model penilaian kesiapan yang siap pakai, dilengkapi dengan bobot dari dimensi dan faktor, dan level kesiapan belum ditemukan untuk konteks RDM khususnya untuk konteks Indonesia. Hasil dari penelitian ini dapat digunakan oleh institusi penelitian untuk menilai kesiapan mereka dan mengidentifikasi area perbaikan dan mengurangi potensi kegagalan dalam implementasi RDM.

Research data is the output of research activities and an important asset for research institutions. Research data management (RDM) is the activity of storing, accessing, and preserving data generated from research projects. RDM adoption in institutions is crucial for fostering data sharing and collaboration. The aim of this study is to provide a model for evaluating RDM preparedness. A model that can be used to help research institutes evaluate their level of preparedness and identify any gaps before developing strategies for implementing RDM. The RDM readiness assessment model consists of two components, namely the readiness model and the readiness assessment method. The readiness model is composed of a number of factors that are prerequisites for preparing institutions to implement RDM. The technology, organization, people, and environment (TOPE) framework is used as a guide in selecting factors and indicators. The Fuzzy Delphi Method is employed to validate the factors and indicators derived from the literature. The derived factors are then integrated with those learned from interviews with research data managers at various research institutions in Indonesia. The RDM readiness model ultimately consists of four dimensions, 13 factors, and 42 indicators after expert validation. The environment, which was not previously covered in studies, is revealed in this study to be a critical aspect in RDM readiness. The assessment technique, which is made up of weighting criteria, assessment instruments, and a readiness level categorization, is the second part of the RDM readiness assessment model. The best-worst method is used to calculate the weights of the readiness dimensions and factors. The order of dimensions based on the amount of weight is technology, people, organization, and environment. Expert reviews are used to determine the size of the range of values at the level of readiness. RDM readiness levels are divided into three categories: low (0 - 1.55), medium (1.556 - 3.45), and high (3.46 - 5.00). In this study, a prototype was developed as a means of validity testing of the readiness assessment model. Black box testing shows that the interface functionality of the prototype is running well. The interface has a satisfactory system usability scale (SUS) score of 73.57. To the best of the researchers' knowledge, there are no ready-to-use readiness assessment models for the RDM context, particularly for the Indonesian environment, that include weights from dimensions and components and levels of readiness. The results of this study can be used by research institutions to assess their readiness and identify areas for improvement and reduce potential failures in RDM implementation."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023

D-pdf

UI - Disertasi Membership Universitas Indonesia Library

Ika Marta Sari

Metode timesvector triclustering dan penerapannya pada data ekspresi gen = Timesvector triclustering method and its application on gene expression data

Analisis triclustering merupakan pengembangan dari analisis clustering dan analisis biclustering. Tujuan dari analisis triclustering yaitu mengelompokkan data tiga dimensi secara simultan atau bersamaan. Data tiga dimensi tersebut dapat berupa observasi, atribut, dan konteks. Salah satu pendekatan yang digunakan dalam analisis triclustering, yaitu pendekatan berdasarkan pattern contohnya, adalah metode Timesvector. Metode Timesvector bertujuan untuk mengelompokkan matriks data yang menunjukkan pola yang sama atau berbeda pada data tiga dimensi. Metode Timesvector memiliki langkah kerja yang dimulai dengan mereduksi matriks data tiga dimensi menjadi matriks data dua dimensi untuk mengurangi kompleksitas dalam pengelompokkan. Pada metode ini akan digunakan algoritma Spherical K-means dalam pengelompokkannya. Tahap selanjutnya, yaitu mengidentifikasi pola dari cluster yang dihasilkan pada Spherical K-means. Pola yang dimaksud terdiri dari tiga jenis, yaitu DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), dan SEP (Similarly Expressed Pattern). Penerapan dari metode Timesvector dilakukan pada data ekspresi gen yaitu data tumor otak yang dilakukan dalam 6 skenario. Masing-masing skenario menggunakan banyak cluster yang sama tetapi nilai threshold yang berbeda-beda. Hasil dari ke enam skenario akan divalidasi menggunakan nilai coverage dan nilai tricluster diffusion (TD). Hasil penerapan metode timesvector menunjukkan bahwa dengan menggunakan threshold sebesar 1,5 memberikan hasil yang paling optimal karena memiliki nilai coverage yang tinggi sebesar 57% dan nilai TD yang rendah sebesar 2,95594E-06. Nilai coverage yang tinggi menunjukkan kemampuan metode dalam mengekstrak data dan nilai TD yang rendah menunjukkan bahwa tricluster yang dihasilkan memiliki volume yang besar dan koherensi yang tinggi. Berdasarkan pola yang dihasilkan menggunakan skenario yang optimal diperoleh sebanyak 49 ODEP cluster dengan pasien ke-empat selalu memiliki pola ekspresi yang berbeda dibandingkan dengan pasien lainya. Hal ini dapat digunakan oleh ahli medis untuk melakukan tindakan selanjutnya terhadap pasien tumor otak.

Triclustering analysis is the development of clustering analysis and biclustering analysis. The purpose of triclustering analysis is to group three-dimensional data simultaneously or simultaneously. The three-dimensional data can be in the form of observations, attributes, and context. One of the approaches used in triclustering analysis, namely an approach based on a pattern, for example, is the Timesvector method. Timesvector method aims to group data matrices that show the same or different patterns in three-dimensional data. The Timesvector method has a work step that starts with reducing the three-dimensional data matrix to a two-dimensional data matrix to reduce complexity in a grouping. In this method, the Spherical K-means algorithm will be used in grouping it. The next step is to identify the pattern of the clusters generated in the Spherical K-means. The pattern referred to consists of three types, namely DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), and SEP (Similar Expressed Pattern). The application of the Timesvector method was carried out on gene expression data, namely brain tumor data carried out in 6 scenarios. Each scenario uses the same many clusters but different threshold values. The results of the six scenarios will be validated using the coverage value and the tricluster diffusion (TD) value. The results of applying the timesvector method show that using a threshold of 1.5 gives the most optimal results because it has a high coverage value of 57% and a low TD value of 2.95594E-06. A high coverage value indicates the method's ability to extract data and a low TD value indicates that the resulting tricluster has a large volume and high coherence. Based on the pattern generated using the optimal scenario, there were 49 ODEP clusters with the fourth patient always having a different expression pattern compared to other patients. This can be used by medical experts to perform further action on brain tumor patients.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Putu Wardiha JS

Perancangan metode klasifikasi spare part maintenance menggunakan statistik multivariat dan teori klasifikasi fuzzy = Design a classification method for spare part of maintenance using multivariate technique and fuzzy classification theory

"ABSTRAK

Tesis ini membahas mengenai cara melakukan pengelompokan spare part maintenance menggunakan teknik multivariat yaitu analisa kluster yang digabungkan dengan klasifikasi fuzzy dan klasifikasi ABC. Tujuan penggunaan ketiga metode pengelompokan ini adalah untuk mendapatkan suatu sistem pengelompokan inventory yang cukup akurat, mengakomodasi lebih dari satu variabel/kriteria pengelompokan dan mudah diaplikasikan oleh profesional. Hasil pengelompokan ini akan digunakan sebagai dasar untuk menentukan metode pengelolaan yang sesuai untuk spare part maintenance tersebut.

ABSTRACT
This thesis is concern about how to classifying spare part of maintenance using one of multivariate technique, cluster analysis, combined with fuzzy classification and ABC classification. The objective of using these three kind of methods is to find accurate inventory classification method which could accommodate more than one variable/criteria and easy to implemented by management professional. Result of this classification will be used to decide the best way to manage the spare part of maintenance."

Depok: Fakultas Teknik Universitas Indonesia, 2010

T27651

UI - Tesis Open Universitas Indonesia Library

Natasha Rosaline

Fuzzy C-Means Clustering dengan Reduksi Dimensi Deep Autoencoders untuk Pendeteksian Topik pada Data Tekstual Twitter = Fuzzy C-Means Clustering with Deep Autoencoders Dimensional Reduction for Topic Detection on Textual Data from Twitter

"Pendeteksian topik merupakan suatu teknik untuk memperoleh informasi dengan cara mengekstrak topik-topik dari kumpulan data yang sangat besar. Salah satu metode yang digunakan untuk pendeteksian topik adalah metode clustering, yaitu Fuzzy C-Means (FCM). Namun, kinerja dari FCM menjadi buruk saat harus melakukan clustering pada data yang berdimensi tinggi. Kelemahan dari FCM tersebut dapat ditanggulangi dengan cara melakukan reduksi dimensi. Pada penelitian ini, digunakan suatu metode deep learning, yaitu Deep Autoencoders (DAE), untuk mereduksi dimensi dari kumpulan data. Metode FCM clustering dengan reduksi dimensi DAE ini disebut Deep Autoencoders-Based Fuzzy C-Means (DFCM). Metode DFCM dibagi menjadi dua tahapan, yakni mereduksi dimensi kumpulan data yang berdimensi tinggi menggunakan Deep Autoencoders, dan melakukan FCM clustering pada data yang telah direduksi. Hasil dari metode DFCM adalah topik-topik. Topik-topik tersebut dievaluasi menggunakan nilai coherence. Pada penelitian ini, dibangun dua metode DFCM, yaitu FCM berbasis DAE dengan satu lapisan tersembunyi (DFCM-single hidden layer) dan FCM berbasis DAE dengan multi lapisan tersembunyi (DFCM-multi hidden layers). Hasil dari kedua metode ini menunjukkan bahwa topik-topik pada DFCM-single hidden layer memiliki nilai coherence lebih tinggi dari topik-topik pada DFCM-multi hidden layers.

Topic detection is a technique to find out information by extracting topics from big data. One method used for topic detection is the clustering method, namely Fuzzy C-Means (FCM). However, the performance of FCM becomes worse when clustering on highdimensional data. That weakness is resolved by dimensional reduction. In this research, deep learning method is used to reduce the dimensions of the data set, namely Deep Autoencoders (DAE). FCM clustering method with DAE dimensional reduction is called Deep Autoencoders-Based Fuzzy C-Means (DFCM). DFCM is divided into two parts. First, reducing the dimensions of high-dimensional data collection using Deep Autoencoders. Second, performing FCM clustering on the reduced data. Results of DFCM are topics. These topics are evaluated using the value of coherence. In this research, two DFCM methods were built, namely DAE with one hidden layer based FCM (DFCM-single hidden layer) and DAE with multi-hidden layers based FCM (DFCMmulti hidden layers). The results of these two methods show that the topics in DFCMsingle hidden layer have a higher coherence value than the topics in DFCM-multi hidden layers."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Egira Adhani Khairunnisa

Analisis Cluster Kinerja Mahasiswa Tahun Pertama Menggunakan Fuzzy C-Means Clustering Dengan Metode Seleksi Fitur Chi-Square = Analysis of The First-Year University Students Performance Clusters Using Fuzzy C-Means Clustering with Chi-Square Feature Selection Method

Saat ini tidak ada keraguan bagi siswa-siswi sekolah menengah untuk melanjutkan pendidikannya ke jenjang universitas. Namun, transisi dari sekolah menengah ke pendidikan tinggi adalah tantangan besar bagi mahasiswa tahun pertama. Kinerja mahasiswa pada tahun pertama cenderung menentukan kinerja mahasiswa tersebut di tahun-tahun akademik berikutnya. Penting untuk mencari karakteristik-karakteristik mahasiswa berdasarkan kinerjanya pada awal tahun semester akademik, sehingga dapat dilakukan pendeteksian awal untuk mencegah penurunan kinerja dan meningkatkan prestasi akademik mahasiswa. Penelitian ini bertujuan untuk mengelompokkan 140 mahasiswa semester pertama. Fitur-fitur diseleksi menggunakan Chi-Square lalu digunakan Fuzzy C-Means clustering untuk mengelompokkan mahasiswa. Dari hasil simulasi, mahasiswa dikelompokkan ke dalam dua cluster dengan kinerja cluster kedua lebih baik dibanding kinerja cluster pertama.

Currently there is no doubt for high school students to continue their education at the university level. However, the transition from high school to university is a major challenge for the first-year students. Moreover, student performance during the first year tends to determine their performance in the following academic years. It is important to find student's characteristics based on their performance at the beginning of the academic semester so that early detection can be done to prevent performance degradation and increase student academic achievement. This study aims to cluster 140 first year students. Features are selected using the Chi-Square feature selection method and then using Fuzzy C-Means clustering to group the students. From simulation result, students are grouped into two clusters with the second cluster's performance is better than the first cluster's performance.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian