Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 155063 dokumen yang sesuai dengan query
cover
Mentari Dian Arimbi
"Kanker serviks merupakan penyakit kanker yang menyerang daerah kelamin. Kanker serviks ini disebabkan oleh infeksi Human Papillomavirus HPV. Terdapat lebih dari 100 tipe HPV yang sudah teridentifikasi, namun tidak semua tipe memiliki tingkat keganasan yang sama. Clustering dapat dilakukan dengan metode partisi atau metode hirarki. Kedua metode tersebut dapat dikombinasikan dengan metode partisi pada level pertama dan hirarki pada level kedua.
Metode ini dikenal dengan nama hybrid clustering. Fase partisi dapat dilakukan menggunakan PAM, K-means, atau Fuzzy c-means. Kami memilih PAM pada level pertama dan Divisive Analysis DIANA pada level kedua untuk memperoleh hasil cluster yang lebih spesifik. Kami memilih hasil clustering yang meminimalkan nilai IDB. Pada penelitian ini dilakukan clustering pada 1252 barisan DNA HPV yang diperoleh dari GenBank. Hasil dari hybrid clustering diperoleh 15 clusters, dan hasil clustering menunjukkan data dapat dikelompokkan berdasarkan genusnya.

Cervical cancer is a type of cancer that attacks the genital areas which may cause death. Cervical cancer is caused by Human Papillomavirus HPV which attacks uterus cells More than 100 types of HPV have been identified, but not all types have the same malignancy. One way to determine which types of HPV high risk lead to cervical cancer is by clustering or grouping data. Clustering can be achieved through partition or hierarchical method. Both clustering methods can be combined by processing partition algorithm in the first level and hierarchical in the second level.
This method is known as a hybrid clustering. The partition phase can be done by using PAM, K means, or Fuzzy c means methods. We selected Divisive Analysis DIANA algorithm for the second level in order to get more accurate clustering. We choose the clustering results which minimize the DBI value. In this work, we conduct the clustering on 1252 HPV DNA sequences data from GenBank. Results of hybrid clustering obtained 15 clusters, and the result shows that the data can be identified by genus.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47118
UI - Tesis Membership  Universitas Indonesia Library
cover
Rosalia Deviana Cahyaningrum
"Penelitian ini bertujuan untuk mengimplementasikan spectral clustering-PAM dengan menggunakan algoritma similaritas serial dan mengimplementasikan algoritma similaritas paralel berbasis CUDA dalam metode spectral clustering pada data microarray gen karsinoma. Implementasi dibantu dengan perangkat lunak R berbasis open source yang digunakan pada algoritma spectral clustering-PAM dengan algoritma similaritas serial dan CUDA yang digunakan pada algoritma similaritas paralel. Pengelompokan data microarray gen karsinoma diawali dengan menormalisasi data menggunakan normalisasi min-max. Pada algoritma spectral clustering-PAM, pertama-tama similaritas antar gen karsinoma dihitung. Selanjutnya, membentuk matriks Laplacian ternormalisasi dari matriks diagonal dan matriks Laplacian tak ternormalisasi. Langkah berikutnya yaitu menghitung eigenvalue dari matriks Laplacian ternormalisasi dan menentukan eigenvector dari eigenvalue terkecil matriks Laplacian ternormalisasi yang disusun menjadi dataset baru untuk dipartisi setiap barisnya menggunakan metode PAM. Berdasarkan running time, waktu yang dibutuhkan untuk menghitung nilai similaritas secara paralel di CUDA 378 kali lebih cepat daripada secara serial di R. Hasil penelitian menunjukkan bahwa spectral clustering-PAM mengelompokkan data microarray gen karsinoma menjadi dua cluster dengan nilai rata-rata silhouette yaitu 0,6458276.

This research aims to implement the spectral clustering PAM using serial similarity algorithm and implement parallel similarity algorithm based on CUDA in spectral clustering method on microarray data of carcinoma genes. Implementation assisted with software based on open source R used in spectral clustering algorithm PAM with serial similarity algorithm and CUDA used to parallel similarity algorithm. Clustering microarray data of carcinoma genes preceded by normalizing the data using min max normalization. In the spectral clustering PAM algorithm, first of all, similarity between genes of carcinoma calculated. Furthermore, forming the normalized Laplacian matrix from diagonal matrix and unnormalized Laplacian matrix. The next step is to calculate the eigenvalues of normalized Laplacian matrix and determine the eigenvectors of k smallest eigenvalues of normalized Laplacian matrix is organized into a new dataset to be partitioned each line using PAM. Based on the running time, the time required to calculate the value of parallel similarity in CUDA is 378 times faster than a serial in R. The results showed that spectral clustering PAM classify microarray data of carcinoma genes into two clusters with an average silhouette value is 0,6458276."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47172
UI - Tesis Membership  Universitas Indonesia Library
cover
Diyah Septi Andryani
"Clustering bertujuan untuk mengklasifikasikan pola yang berbeda ke dalam kelompok yang disebut cluster. Analisis gen dengan menggunakan metode clustering dinilai lebih akurat dibandingkan analisis nukleotida menggunakan penyejajaran DNA. Hybrid clustering pada tesis ini mengkombinasikan algoritma fuzzy c-means dan algoritma divisive mampu meningkatkan keakurasian jika dibandingkan pendekatan pengelompokan partitional tradisional. Algoritma divisive akan dijalankan pada step kedua setelah hasil clustering yang diperoleh dari pengelompokan partisi fuzzy c-means.
Penentuan jumlah cluster terbaik ditentukan dari nilai Indeks Davies Bauldin yang paling minimum. Sebanyak 1252 barisan DNA HPV Human papillomavirus diperoleh dari Genbank NCBI dengan proses melakukan ekstraksi ciri DNA, selanjutnya dilakukan normalisasi. Proses ekstraksi ciri, normalisasi, dan penerapan algoritma partisi fuzzy c-means dan divisive dalam metode hybrid clustering menggunakan bantuan program open source.
Pada hasil hybrid clustering level awal diperoleh jumlah cluster optimum sebanyak 3 cluster dengan nilai Indeks Davies Bouldin paling minimum adalah 0.9715919. Pada level ke-2 clustering didapatkan cluster ke-1 terbagi atas 9 sub cluster dengan nilai IDB minimum adalah 0.8909797. Cluster ke-2 terbagi atas 2 sub cluster dengan nilai IDB minimum adalah 0.7650508. Cluster 3 terbagi atas 2 sub cluster dengan nilai IDB minimum adalah 0.9112528. Nilai IDB pada level kedua selalu lebih kecil dibanding nilai IDB pada level 1. Hal ini mengindikasikan bahwa hybrid clustering memberikan hasil yang lebih baik terhadap hasil clustering.

Clustering aims to classify the different patterns into groups called clusters. Analysis gene by using clustering method is considered more accurate than analysis of nucleotide using DNA alignment. In this thesis, hybrid clustering algorithm which combines fuzzy c means and algorithm divisive will be improve accuracy when compared to partitional clustering. Divisive algorithms will applied on second level after clustering partition using fuzzy c means.
To find the best number of clusters is determined using the minimum value of Davies Bouldin Index DBI of the cluster results. The data is 1252 sequences of HPV DNA sequences obtained from Gen Bank Database in the National Centre for Biotechnology Information NCBI at http www.ncbi.nlm.nih.gov in FASTA format. The data is converted into numerical form through feature extraction using n mers frequency.
The results on first level hybrid clustering obtained the optimum cluster divided into three clusters with the value of the minimum Davies Bouldin Index is 0.9715919. Morever, DBI values after implementing the second step of clustering are always producing smaller IDB values compare to the results of using first step clustering only. This condition indicates that the hybrid approach in this study produce better performance of the cluster results, in term its DBI values.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47171
UI - Tesis Membership  Universitas Indonesia Library
cover
Fajar Agung Prasetyo
"Indonesia merupakan salah satu negara di dunia yang masih menerapkan subsidi untuk Bahan Bakar Minyak (BBM). Pemerintah Indonesia sesuai dengan amanah undang-undang harus menjamin penyediaan dan pendistribusian BBM bagi seluruh rakyat Indonesia. Untuk menerapkan kebijakan ini dengan tepat maka pemahaman akan pola konsumsi BBM menjadi hal yang sangat fundamental karena setiap daerah memiliki hak yang sama dalam memperoleh sumber energi termasuk BBM. Penelitian ini menggunakan metode clustering untuk mengetahui kategori kabupaten/kota berdasarkan pola konsumsi BBM subsidi. Data yang digunakan adalah data konsumsi BBM subsidi sejak Januari tahun 2016 hingga Juni tahun 2021 dalam bentuk time series. Penelitian ini membandingkan beberapa metode clustering yaitu k-means, Partitioning Around Medoid (PAM) dan Clustering Large Applications (CLARA). Hasil yang diperoleh adalah k-means menjadi metode clustering yang paling optimal untuk analisis konsumsi BBM subsidi setelah dilakukan evaluasi terhadap nilai rata-rata Silhouette, Dunn Index dan Connectivity. Hasil clustering dengan metode k-means mengindikasikan adanya dua cluster kabupaten/kota yang memiliki tingkat kerentanan terhadap konsumsi BBM yang tinggi dan rendah. Pemerintah perlu menetapkan daerah prioritas dalam pengawasan penggunaan BBM subsidi terutama daerah dengan tingkat kerentanan penggunaan BBM subsidi yang tinggi serta untuk daerah yang memiliki tingkat kerentanan rendah pemerintah perlu meninjau kembali kuota BBM subsidi yang ditetapkan

Indonesia is one of the countries in the world that still applies subsidies for fuel oil (BBM). The Indonesian government following the mandate of the law must ensure the supply and distribution of fuel for all Indonesian people. Understanding the pattern of fuel consumption is very fundamental because every region has the same rights in obtaining energy sources, including fuel. This study uses the clustering method to determine the category of districts/cities based on the pattern of consumption of subsidized fuel. The data used is data on subsidized fuel consumption from January 2016 to June 2021 in the form of a time series. This study compares several clustering methods, namely k-means, Partitioning Around Medoid (PAM), and Clustering Large Applications (CLARA). The results found that k-means becomes the most optimal clustering method for the analysis of subsidized fuel consumption after evaluating the values of Silhouette, Dunn Index, and Connectivity. The results indicate that two district/city clusters have high and low levels of vulnerability to fuel consumption. The government needs to determine priority areas in supervising the use of subsidized fuel, and for areas that have a low level of vulnerability, the government needs to review the quota for subsidized fuel that has been set."
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Muh. Ardi Ramdani
"Berdasarkan standar prevalensi stunting yang ditetapkan oleh WHO, yaitu sebesar 20%,
tingkat prevalensi stunting di Indonesia masih cukup tinggi. Oleh sebab itu, pada tahun
2018 pemerintah menetapkan 100 kabupaten prioritas penurunan angka stunting.
Penentuan 100 kabupaten tersebut hanya didasarkan pada kriteria jumlah dan prevalensi
balita stunting yang dibobot dengan tingkat kemiskinan provinsi (desa-kota). Akibatnya,
akan tidak efektif apabila pemerintah memberikan alokasi APBN, APBD, dan perhatian
yang merata pada 100 daerah prioritas tanpa melihat kondisi pada masing-masing
kabupaten untuk indikator yang lain. Dengan demikian, diperlukan analisis
pengelompokan 100 kabupaten prioritas intervensi stunting pada tahun 2018 berdasarkan
pada indikator-indikator yang telah ditetapkan oleh Tim Nasional Percepatan
Penanggulangan Kemiskinan untuk melihat kondisi keparahan stunting. Analisis
pengelompokan ini diharapkan dapat dijadikan acuan bagi pemerintah dalam penentuan
kelompok kabupaten prioritas dan diharapkan pemerintah dapat mengambil kebijakan
yang tepat sesuai dengan kondisi masing-masing kelompok. Banyaknya observasi yang
digunakan adalah 100 kabupaten prioritas intervensi stunting tahun 2018 dengan terdapat
delapan variabel numerik dan enam variabel kategorik. Adapun metode yang digunakan
adalah metode Partitioning Around Medoids (PAM) dengan menggunakan Gower
distance yang mampu menangani pengelompokan pada tipe data campuran. Hasil dari
penelitian ini menunjukkan bahwa terbentuk lima kelompok kabupaten yang memiliki
karakteristik masing-masing. Diperoleh bahwa Cluster 5 memiliki kondisi yang relatif
paling buruk di antara cluster lainnya untuk setiap indikator, sehingga sebaiknya menjadi
kelompok kabupaten prioritas pertama dalam penanganan kasus stunting. Cluster yang
menjadi prioritas kedua adalah cluster 4, prioritas ketiga adalah cluster 2, dan prioritas
keempat adalah cluster 3. Cluster 1 memiliki kondisi yang relatif paling baik di antara
cluster lainnya, sehingga menjadi prioritas terakhir. Kabupaten-kabupaten yang berasal
dari Provinsi Papua dan Provinsi NTT secara garis besar merupakan kabupatenkabupaten
yang memiliki kondisi keparahan stunting yang buruk, dengan mayoritas
merupakan anggota cluster 2, cluster 4, dan cluster 5. Secara umum untuk lebih
meningkatkan upaya penurunan angka stunting pada 100 kabupaten prioritas, pemerintah
perlu mengoptimalkan upaya penurunan angka kemiskinan, meningkatkan proporsi
penduduk dengan perilaku BAB di jamban, meningkatkan akses masyarakat terhadap air
bersih dan akses masyarakat terhadap sanitasi yang baik, meningkatkan jumlah posyandu
per desa, dan meningkatkan ketersediaan jumlah dokter pada masing-masing kabupaten

Based on the stunting prevalence standard set by WHO, which is 20%, the stunting
prevalence rate in Indonesia is still quite high. Therefore, in 2018 the government set 100
priority districts to reduce stunting rates. The determination of the 100 regencies only
based on the criteria of the number and prevalence of stunted children weighted by the
provincial (rural-urban) poverty rate. As a result, it will be ineffective if the government
allocates the state budget, regional budget, and equal attention to 100 priority areas
without looking at each district’s conditions for other indicators. Therefore, an analysis
of the 100 priority districts for stunting intervention needed in 2018 based on indicators
established by the National Team for the Acceleration of Poverty Reduction to see the
condition of the severity of stunting. This grouping analysis expected to use as a reference
for the government in determining priority district groups and expected the government
to take appropriate policies by each group’s conditions. The number of observations used
was 100 priority districts for stunting intervention in 2018 with eight numerical variables
and six categorical variables. The method used is the Partitioning Around Medoids (PAM)
method using a Gower distance that believed to handle grouping on mixed data types.
The results of this study indicate that five district groups formed that have their respective
characteristics. It found that cluster 5 had the relatively worst condition among the other
clusters for each indicator, so it should be the priority group in handling stunting cases.
The second priority cluster is cluster 4, the third priority is cluster 2, and the fourth priority
is cluster 3. Cluster 1 has the relatively best condition among other clusters, so it becomes
the last priority. Districts originating from Papua Province and East Nusa Tenggara
Province are generally districts that have reduced stunting severity, with the majority
being members of cluster 2, cluster 4, and cluster 5. In general, to further increase efforts
to reduce stunting rates at 100 priority districts, the government needs to optimize efforts
to reduce poverty, increase the proportion of the population with defecation behavior in
latrines, increase community access to clean water and community access to proper
sanitation, increase the number of posyandu per village, and increase the availability of
doctors in each district
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Khoirul Umam
"DNA adalah salah satu pembawa informasi genetik pada makhluk hidup. Sequencing dan clustering barisan DNA telah menjadi pekerjaan utama dan rutin dalam dunia biologi molekuler, khususnya dalam bidang terapan bioinformatika. Secara umum metode clustering dapat dibedakan menjadi dua, yaitu hirarki clustering dan partisi clustering. Penelitian ini menggabungkan dua metode clustering yaitu K-Means partisi clustering pada Level 1 dan DIANA hirarki clustering pada Level 2, oleh karena itu disebut Two-Level Hybrid Clustering. Proses awal dimulai dengan mengumpulkan barisan DNA HPV yang diperoleh dari NCBI National Centre for Biotechnology Information, Ekstraksi Ciri, dan Normalisasi. Kemudian melakukan proses clustering menggunakan algoritma K-Means pada Level 1 dan algoritma DIANA pada Level 2. Untuk menghitung jarak genetik antar barisan DNA HPV digunakan persamaan Euclidian Distance. Dan validitas klaster yang digunakan untuk menentukan banyaknya klaster yang optimum adalah Indeks Davies-Bouldin IDB. Hasil penerapan Two-Level Hybrid Clustering pada 1252 barisan DNA HPV adalah data dikelompokan menjadi 4 klaster dengan nilai IDB yaitu 0.859154564. Semua perhitungan dan proses clustering menggunakan software R.

DNA is one of the carrier of genetic information in living organisms. Sequencing and clustering DNA sequences has become the key and routine activitis in the molecular biology, in particular on bioinformatics applications. There are two type of clustering, hierarchical clustering and partitioning clustering. In this paper, we combine two type clustering proccesses including K Means partitioning clustering on Level 1 and DIANA hierarchical clustering on Level 2, therefore it called Two Level Hybrid clustering. The beginning of process is started with collecting DNA sequences of HPV from NCBI National Centre for Biotechnology Information, Characteristics Extraction, and Normalization. The next step is clustering by implementation K Means algorithm on Level 1 and DIANA algorithm on Level 2. To calculate the genetic distance we use Euclidian Distance. Moreover, in validating cluster results in order to get optimum number of clusters, we use Davies Bouldin Index DBI. The result of implementation of Two Level Hybrid Clustering on 1252 sequences of HPV is the data clustered into 4 clusters with minimal IDB value is 0.859154564. All calculating and clustering process in this paper using software R.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47109
UI - Tesis Membership  Universitas Indonesia Library
cover
Cynthia
"Dengue adalah salah satu penyakit endemik yang terjadi pada banyak daerah sub tropis dan tropis. Nyamuk Aedes aegypti merupakan vektor utama penyakit dengue. Jumlah insiden dengue telah meningkat secara drastis di seluruh dunia dalam beberapa dekade terakhir. Perubahan iklim dapat menyebabkan perubahan curah hujan, suhu, kelembapan, dan arah udara, sehingga dapat berpengaruh pada perkembangbiakan hidup nyamuk Aedes. Pada skripsi ini, penulis mengimplementasikan algoritma ­K-Medoids dan Fuzzy C-Means Clustering menggunakan jarak Euclidean pada data insiden dengue dan cuaca yang diambil dari kelima wilayah di DKI Jakarta pada tahun 2009 hingga 2016. Variabel yang digunakan terdiri atas rata-rata temperatur, rata-rata kelembapan udara relatif, curah hujan, dan insiden dengue. Proses implementasi dalam skripsi ini dibedakan atas 2 skenario penelitian, yaitu menggunakan 4 variabel yang telah disebutkan di atas dan 3 variabel (variabel yang sama seperti sebelumnya, namun tanpa variabel insiden dengue). Tujuan penelitian dalam skripsi ini adalah menganalisis keterkaitan antara variabel cuaca tersebut dan insiden dengue dari kelima wilayah di DKI Jakarta. Untuk menentukan jumlah klaster yang digunakan, pada metode K-Medoids Clustering dilakukan perhitungan Silhouette Coefficient dan pada metode Fuzzy C-Means Clustering dilakukan perhitungan Modified Partition Coefficient. Hasil menunjukkan bahwa terdapat korelasi yang cenderung positif antara insiden dengue dengan rata-rata kelembapan udara relatif dan jumlah curah hujan di DKI Jakarta. Sementara itu, terdapat korelasi yang cenderung negatif antara jumlah insiden dengue dengan rata-rata temperatur di DKI Jakarta. Hasil dari kedua skenario menunjukkan bahwa terdapat kemiripan nilai rata-rata temperatur yang terjadi antara Jakarta Pusat dan Jakarta Utara, serta antara Jakarta Timur, Jakarta Selatan, dan Jakarta Barat. Kemiripan nilai rata-rata kelembapan udara relatif juga terjadi pada wilayah-wilayah seperti yang telah disebutkan sebelumnya. Hasil dari kedua skenario juga menunjukkan bahwa insiden dengue yang terjadi di Jakarta Pusat dan Jakarta Utara cenderung lebih rendah dari Jakarta Timur, Jakarta Barat, dan Jakarta Selatan. Berdasarkan hasil yang diperoleh, pembentukan klaster pada skenario pertama cenderung dipengaruhi oleh jumlah insiden dengue. Sementara itu, pembentukan klaster pada skenario kedua cenderung dipengaruhi oleh jumlah curah hujan.

Dengue is an endemic disease prevalent in sub-tropical and tropical regions. The Aedes aegypti mosquito is the main vector of dengue. Dengue incidence has been rising dramatically throughout the last few decades. Climate change may lead to changes in rainfall, temperature, humidity, and wind direction, so that it can affect the breeding of Aedes mosquitoes. In this study, we employ K-Medoids Clustering and Fuzzy C-Means (FCM) Clustering algorithms using Euclidean distance on five regions in DKI Jakarta every year from 2009 to 2016. The variables used consist of average temperature, average relative humidity, rainfall, and dengue incidence. The implementation process in this study is divided into 2 research scenarios. Firstly using the 4 variables that was mentioned above, and secondly using 3 variables (the same variables as before, but without the dengue incidence variable). The purpose of this study is to analyze the relationships between these weather variables and dengue incidence in the five regions in DKI Jakarta. In order to determine the number of clusters used, for K-Medoids Clustering we determine the Silhouette Coefficient, and for Fuzzy C-Means Clustering we determine the Modified Partition Coefficient. The results show that there tends to be a positive correlation between the number of dengue incidence with average relative humidity and the amount of rainfall. On the other hand, there tends to be a negative correlation between the number of dengue incidence with the average temperature. The results of the two scenarios show that there are similarities in the average temperature between Central Jakarta and North Jakarta, as well as between the East Jakarta, South Jakarta, and West Jakarta. Similarities in the average relative humidity also occur in the areas mentioned before. The results of both scenarios also show that the dengue incidence in Central Jakarta and North Jakarta tend to be lower than in East Jakarta, West Jakarta, and South Jakarta. Based on the results, cluster formation in the first scenario tends to be influenced by the number of dengue incidence. Meanwhile, cluster formation in the second scenario tends to be influenced by the amount of rainfall."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hengki Muradi
"[Salah satu tujuan dalam studi ekpresi gen (DNA/Protein) adalah menemukan subbagian
yang penting secara biologis dan kelompok-kelompok dari gen-gen. Pengelompokan gen tersebut dapat dilakukan dengan metode hirarki maupun metode partisi. Kedua metode pengelompokan dapat dikombinasikan, dimana
dilakukan fase partisi dan hirarki secara bergantian, metode ini dikenal dengan metode Hopach. Tahap partisi dapat dilakukan dengan metode PAM, SOM, atau K-Means. Proses partisi dilanjutkan dengan proses Ordered, baru kemudian dikoreksi dengan proses agglomorative, sehingga hasil pengelompokan menjadi lebih akurat. Dalam menentukan kelompok utama digunakan ukuran MSS (Median Split Silhouette). MSS mengukur homogenitas hasil pengelompokan,
dimana hasil pengelompokan yang dipilih adalah yang meminimumkan MSS. Pada pengelompokan 136 barisan DNA Virus Ebola dari GeneBank. Proses
awalnya dilakukan pensejajaran global, dan dilanjutkan dengan perhitungan jarak genetik dengan menggunakan koreksi Jukes-Cantor. Pada penelitian ini didapat jarak genetik maksimum adalah 0.6153407 sedangkan jarak genetik minimum adalah 0. Selanjutnya matriks jarak genetik dapat dijadikan dasar untuk mengelompokkan barisan-barisan tersebut dengan menggunakan metode Hopach. Pada hasil pengelompokan Hopach-PAM, diperoleh kelompok utama sebanyak 10 kelompok dengan nilai MSS sebesar 0,8873843. Kelompok-kelompok virus ebola dapat diidentifikasikan berdasarkan subspesies dan tahun pertama kali mewabah.
Proses pensejajaran global dan pengelompokan Hopach-PAM menggunakan bantuan program open source R.

One goal in the study of gene expression (DNA/Protein) is finding biologically important subsets and clusters of genes. Clustering these genes can be achieved by hierarchical and partitioning methods. Both clustering methods can be combined, where partition and hierarchy phases can be executed alternately, this method is known as a Hopach method. The partitioning step can be done by the PAM, SOM, or K-Means clustering method. The partition process continued with the process of Ordered, then corrected with agglomorative process, so that the clustminering results become more accurate. The main clusters determine by using MSS
(Median Split Silhouette). MSS is used to measure homogeneity of the clustering result, in which the clustering is selected to minimize its MSS. The clustering procceses of 136 DNA sequences of Ebola virus, are started by performing a global alignment, and continued with the genetic distance calculations using
Jukes-Cantor correction. In this research we found the maximum genetic distance is 0.6153407, meanwhile the minimum genetic distance is 0. Furthermore, the genetic distance matrix can be used as a basis for clustering sequences in Hopach-PAM clustering method. Based on, the clustering results, we obtained 10 major clusters with MSS value of 0.8873843. Ebola virus clusters can be identified by subspecies and the first occoring year of their outbreak. We implemented the global alignment process and Hopach-PAM clustering algorithm using the open source program R.;One goal in the study of gene expression (DNA/Protein) is finding biologically important subsets and clusters of genes. Clustering these genes can be achieved by hierarchical and partitioning methods. Both clustering methods can be combined, where partition and hierarchy phases can be executed alternately, this method is known as a Hopach method. The partitioning step can be done by the PAM, SOM, K-Means clustering method. The partition process continued with the process
of Ordered, then corrected with agglomorative process, so that the clustmineringresults become more accurate. The main clusters determine by using MSS (Median Split Silhouette). MSS is used to measure homogeneity of the clustering result, in which the clustering is selected to minimize its MSS. The clustering procceses of 136 DNA sequences of Ebola virus, are started by performing a global alignment, and continued with the genetic distance calculations using Jukes-Cantor correction. In this research we found the maximum genetic distance is 0.6153407, meanwhile the minimum genetic distance is 0. Furthermore, the genetic distance matrix can be used as a basis for clustering sequences in Hopach-PAM clustering method. Based on, the clustering results, we obtained 10 major clusters with MSS value of 0.8873843. Ebola virus clusters can be identified by subspecies and the first occoring year of their outbreak. We implemented the global alignment process and Hopach-PAM clustering algorithm using the open
source program R., One goal in the study of gene expression (DNA/Protein) is finding biologically
important subsets and clusters of genes. Clustering these genes can be achieved by
hierarchical and partitioning methods. Both clustering methods can be combined,
where partition and hierarchy phases can be executed alternately, this method is
known as a Hopach method. The partitioning step can be done by the PAM, SOM,
or K-Means clustering method. The partition process continued with the process
of Ordered, then corrected with agglomorative process, so that the clustminering
results become more accurate. The main clusters determine by using MSS
(Median Split Silhouette). MSS is used to measure homogeneity of the clustering
result, in which the clustering is selected to minimize its MSS. The clustering
procceses of 136 DNA sequences of Ebola virus, are started by performing a
global alignment, and continued with the genetic distance calculations using
Jukes-Cantor correction. In this research we found the maximum genetic distance
is 0.6153407, meanwhile the minimum genetic distance is 0. Furthermore, the
genetic distance matrix can be used as a basis for clustering sequences in Hopach-
PAM clustering method. Based on, the clustering results, we obtained 10 major
clusters with MSS value of 0.8873843. Ebola virus clusters can be identified by
subspecies and the first occoring year of their outbreak. We implemented the
global alignment process and Hopach-PAM clustering algorithm using the open
source program R.]
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2015
T43650
UI - Tesis Membership  Universitas Indonesia Library
cover
Fahrezal Zubedi
"Pada penelitian ini mengimplementasikan algoritma Similarity Based Biclustering dengan menggunakan PAM clustering pada tiga dataset ekspresi gen microarray. Penelitian ini bertujuan untuk mengetahui ekspresi regulasi dari masing-masing bicluster yang diperoleh dan mengetahui kinerja algoritma Similarity Based Biclustering-PAM clustering berdasarkan hasil analisis kelompok kondisi. Similarity based biclustering-PAM clustering secara teoritis terdiri dari empat tahap utama yaitu: mentransformasi data, membangun matriks similaritas, proses clustering khususnya dalam tesis ini menggunakan metode partisi PAM dan mengekstrak bicluster. Algoritma similarity based biclustering-PAM clustering dapat mengetahui ekspresi regulasi dari tiap bicluster pada tiga dataset yaitu: Diabetes Melitus tipe II, Diabetes Retinopati, dan Limfoma. Akurasi yang diperoleh dari algoritma Similarity Based Biclustering untuk masing-masing dataset yaitu Diabetes Melitus tipe II sebesar 0.55, Diabetes Retinopati sebesar 0.80 dan Limfoma sebesar 0.83.

In this research implements Similarity Based Biclustering algorithm by using PAM Clustering method in three dataset of microarray gene expression. Aim of this research is to know the regulated expression of each obtained bicluster and to know the performance of Similarity Based Biclustering PAM Clustering algorithm based on the result of group condition analysis. Similarity Based Biclustering is theoretically composed of four main stages transforming data, constructing matrix similarity, clustering process, especially in this thesis using PAM partition algorithm and extracting bicluster. Similarity Based Biclustering PAM is able to know the regulatory expression of each bicluster in three datasets Diabetes Mellitus type 2, Diabetes Retinopathy, and Lymphoma. Accuracy obtained from Similarity Based Biclustering algorithm for each dataset is 0.55 in data of type 2 diabetes mellitus, 0.80 in diabetic retinopathy data and 0.83 in lymphoma data.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49505
UI - Tesis Membership  Universitas Indonesia Library
cover
Cindy
"Dengue adalah penyakit infeksi yang menjadi masalah kesehatan serius di dunia. Jumlah insiden dengue di Indonesia terus meningkat sejak tahun 1968, namun pada beberapa tahun belakangan, jumlah penderita dengue cenderung fluktuatif. Faktor-faktor cuaca cenderung memiliki hubungan dengan insiden dengue di Indonesia. Pada skripsi ini, dilakukan analisis pada data time-series cuaca dan insiden dengue pada wilayah DKI Jakarta dari Januari 2008 sampai September 2017. Clustering dapat digunakan untuk menemukan pola pada dataset time-series yang besar dan berisi informasi berharga. Pada skripsi ini, digunakan pendekatan K-Medoids dan Fuzzy C-Means Clustering menggunakan jarak Dynamic Time Warping (DTW). Skripsi ini bertujuan untuk menganalisis pola faktor-faktor cuaca dan insiden dengue di lima wilayah DKI Jakarta (Jakarta Utara, Jakarta Timur, Jakarta Barat, Jakarta Selatan, dan Jakarta Pusat). Faktor-faktor cuaca yang digunakan terdiri dari rata-rata temperatur, curah hujan, rata-rata kelembapan relatif, sinar matahari, dan rata-rata kecepatan angin. Sebelum clustering dilakukan, nilai Silhouette Coefficient digunakan untuk menentukan jumlah cluster yang optimal pada K-Medoids Clustering. Sedangkan, nilai Modified Partition Coefficient digunakan untuk menentukan jumlah cluster yang optimal pada Fuzzy C-Means Clustering. Hasil implementasi menunjukkan bahwa curah hujan merupakan faktor cuaca yang memiliki pola yang paling serupa dengan insiden dengue di kelima wilayah DKI Jakarta. Selain itu, sinar matahari, rata-rata temperatur, dan rata-rata kelembapan relatif juga cenderung memiliki pola yang serupa. Rata-rata kecepatan angin juga cenderung memiliki pola yang serupa dengan curah hujan dan insiden dengue, atau dengan sinar matahari, rata-rata temperatur, dan rata-rata kelembapan relatif.

Dengue is an infectious disease which has become a serious issue throughout the world. Since 1968, the incidence of dengue in Indonesia has continued to increase every year, but in recent years it tended to fluctuate. Weather factors are associated with the incidence of dengue in Indonesia. In this thesis, an analysis of weather time-series data and dengue incidence is done in the DKI Jakarta area from January 2008 to September 2017. Clustering can be used to discover patterns in large time-series datasets which contain valuable information. In this thesis, the K-Medoids and Fuzzy C-Means Clustering approaches using Dynamic Time Warping (DTW) distance are employed. This thesis aims to analyze patterns of weather factors and dengue incidence in the five regions of DKI Jakarta (North Jakarta, East Jakarta, West Jakarta, South Jakarta and Central Jakarta). The weather variables consist of average temperature, rainfall, average relative humidity, sunshine, and average wind speed. Before the clustering process, the Silhouette Coefficient value is used to determine the optimal number of clusters in K-Medoids Clustering. Meanwhile, the Modified Partition Coefficient value is used to determine the optimal number of clusters in Fuzzy C-Means Clustering. The implementation results show that rainfall is the weather factor which has the most similar pattern to the dengue incidence in the five regions of DKI Jakarta. In addition, sunshine, average temperature, and average relative humidity also tend to have a similar pattern with each other. Average wind speed also tends to have a pattern similar to rainfall and dengue incidence, or with sunshine, average temperature, and average relative humidity."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>