Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query
cover
Situmeang, Jason Nimrod Joshua
"

Penelitian ini bertujuan untuk melakukan pengelompokan varian virus SARS-CoV-2 melalui proses clustering menggunakan metode unsupervised learning. Data yang digunakan adalah sekuens protein SARS-CoV-2 yang diekstraksi fiturnya menggunakan paket Discere dalam bahasa pemrograman Python. Sebanyak 27 fitur dihasilkan dan diseleksi dengan metode seleksi fitur Least Absolute Shrinkage and Selection Operator (LASSO). Metode Elbow digunakan untuk menentukan jumlah cluster yang optimal. Dalam penelitian ini, digunakan metode clustering K-Means dan Balanced Iterative Reducing and Clustering using Hierarchies (BIRCH). Evaluasi hasil clustering dilakukan menggunakan metrik evaluasi Silhouette Score dan Davies-Bouldin Index, serta memperhatikan waktu runtime untuk setiap simulasi. Hasil evaluasi kemudian dibandingkan untuk melihat perbedaan performa antara kedua metode clustering yang digunakan, serta pengaruh seleksi fitur terhadap performa clustering. Hasil terbaik diperoleh pada simulasi dengan metode clustering BIRCH + LASSO, dengan nilai Silhouette Score 0,74186 untuk jumlah cluster k=4 dan 0,73207 untuk k=5. Nilai Davies-Bouldin Index terbaik juga diperoleh pada simulasi tersebut, yaitu 0,42697 untuk k=4 dan 0,37949 untuk k=5. Waktu runtime terbaik tercatat pada simulasi dengan metode K-Means + LASSO, yaitu 0,21551 detik untuk k=4 dan 0,17539 detik untuk k=5. Dapat disimpulkan bahwa metode BIRCH menghasilkan cluster yang lebih baik berdasarkan metrik evaluasi, namun K-Means memberikan proses clustering yang lebih cepat. Seleksi fitur dengan metode LASSO juga membantu meningkatkan performa clustering.


This study aims to perform clustering of SARS-CoV-2 virus variants using unsupervised learning methods. The data used consists of SARS-CoV-2 protein sequences whose features are extracted using the Discere package in the Python programming language. A total of 27 features are generated and selected using the Least Absolute Shrinkage and Selection Operator (LASSO) feature selection method. The Elbow method is employed to determine the optimal number of clusters for the clustering process. The clustering methods used in this research are K-Means clustering and Balanced Iterative Reducing and Clustering using Hierarchies (BIRCH). The clustering results are evaluated using the Silhouette Score and Davies-Bouldin Index metrics, while also considering the runtime for each simulation. The evaluation results are then compared to examine the performance differences between the two clustering methods and the impact of feature selection on clustering performance. The best Silhouette Score is obtained in the simulation using the BIRCH + LASSO clustering method, with a value of 0.74186 for k=4 and 0.73207 for k=5. The best Davies-Bouldin Index is also achieved in the same simulation, with values of 0.42697 for k=4 and 0.37949 for k=5. The fastest runtime is recorded in the simulation using the K-Means + LASSO method, with a time of 0.21551 seconds for k=4 and 0.17539 seconds for k=5. In conclusion, the BIRCH method yields better clustering results based on the evaluation metrics, while K-Means provides faster clustering processes. The LASSO feature selection method also aids in improving clustering performance.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hans Carlo Adrianto
"Indonesia merupakan produsen utama minyak kelapa sawit di dunia sekaligus penyumbang devisa terbesar dari sektor perkebunan. Namun demikian, produktivitas kelapa sawit nasional menunjukkan tren penurunan, meskipun luas areal tanam terus meningkat setiap tahunnya. Penurunan ini disebabkan oleh berbagai faktor, seperti tingginya proporsi pohon tua yang belum diremajakan, rendahnya efektivitas program replanting terutama di perkebunan rakyat, terbatasnya akses petani terhadap benih unggul dan teknologi modern, serta masih maraknya peredaran benih palsu. Penelitian ini bertujuan untuk mengelompokkan provinsi-provinsi penghasil kelapa sawit berdasarkan karakteristik produktivitas dan luas tanaman menghasilkan (TM), guna memberikan dasar bagi rekomendasi kebijakan yang lebih tepat sasaran. Metode yang digunakan adalah Hierarchical Clustering dengan jumlah klaster (k) = 2, yang dipilih karena memberikan struktur klaster yang terpisah dengan baik dan mudah divisualisasikan. Metode ini dibandingkan dengan K-Means Clustering dan divalidasi melalui pengukuran validitas internal (Silhouette Score = 0,298; Calinski-Harabasz Index = 9,105; Davies-Bouldin Index = 1,477; dan Dunn Index = 0,457) serta validitas eksternal (Adjusted Rand Index = 0,419; F-value = 60,64; dan p-value = 5,07e-08). Hasil validasi menunjukkan klaster yang terbentuk cukup representatif dan stabil. Hasil klasterisasi menghasilkan dua kelompok utama, yaitu Klaster 1 berlabel “Kebun Kurang Produktif dan Tidak Stabil” dan Klaster 2 berlabel “Kebun Produktif dan Efisien”. Klaster 1 terdiri dari provinsi-provinsi yang didominasi oleh perkebunan rakyat dengan produktivitas rendah, fluktuasi hasil panen tinggi, dan tren pertumbuhan negatif. Klaster ini juga menunjukkan keterbatasan luas tanaman menghasilkan serta nilai UMR yang lebih rendah dari rata-rata nasional. Sebaliknya, Klaster 2 terdiri dari wilayah dengan produktivitas tinggi dan stabil, didukung oleh pengelolaan kebun yang efisien dan akses terhadap teknologi yang memadai. Berdasarkan hasil tersebut, penelitian ini merekomendasikan intervensi kebijakan khusus untuk Klaster 1, di antaranya percepatan program replanting, penguatan akses terhadap benih unggul dan teknologi pertanian, serta peningkatan kapasitas manajemen kebun dan sumber daya manusia (SDM). Penelitian ini diharapkan dapat memberikan kontribusi terhadap strategi pengembangan sektor kelapa sawit nasional melalui pendekatan kebijakan berbasis data.

Indonesia is the world's leading producer of palm oil and the largest contributor to foreign exchange earnings from the plantation sector. However, national palm oil productivity is showing a downward trend, even though the area under cultivation continues to increase every year. This decline is attributed to various factors, including a high proportion of old trees that have not been replanted, low effectiveness of replanting programs, particularly in smallholder plantations, limited access for farmers to high-quality seeds and modern technology, and the widespread circulation of counterfeit seeds. This study aims to group palm oil-producing provinces based on productivity characteristics and productive area (PA) to provide a basis for more targeted policy recommendations. The method used is Hierarchical Clustering with the number of clusters (k) = 2, chosen because it provides a well-separated cluster structure that is easy to visualize. This method was compared with K-Means Clustering and validated through internal validity measurements (Silhouette Score = 0.298; Calinski-Harabasz Index = 9.105; Davies-Bouldin Index = 1.477; and Dunn Index = 0.457) as well as external validity (Adjusted Rand Index = 0.419; F-value = 60.64; and p-value = 5.07e-08). The validation results indicate that the clusters formed are sufficiently representative and stable. The clustering results yield two main groups: Cluster 1 labeled “Low-Productive and Unstable Plantations” and Cluster 2 labeled “Productive and Efficient Plantations.” Cluster 1 consists of provinces dominated by smallholder plantations with low productivity, high harvest yield fluctuations, and negative growth trends. This cluster also shows limitations in the area of productive crops and a lower UMR value than the national average. Conversely, Cluster 2 consists of regions with high and stable productivity, supported by efficient plantation management and adequate access to technology. Based on these findings, this study recommends specific policy interventions for Cluster 1, including accelerating replanting programs, strengthening access to high-quality seeds and agricultural technology, and enhancing plantation management capacity and human resources (HR). This study is expected to contribute to national palm oil sector development strategies through a data-driven policy approach."
Depok: Fakultas Teknik Universitas Indonesia, 2025
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library