Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 16 dokumen yang sesuai dengan query
cover
Annisa Kamalia
Abstrak :
ABSTRACT
Talasemia adalah penyakit yang disebabkan oleh adanya kelainan dalam hemoglobin. Penyakit talasemia merupakan penyakit herediter atau penyakit keturunan dimana pembawa gen talasemia adalah orang tua dari penderita. Di Indonesia, pada tahun 2015 diketahui jumlah kasus talasemia mencapai 7.029 kasus. Sampai saat ini talasemia belum dapat disembuhkan namun dapat dikenali sifat pembawanya dengan skrining. Dalam tugas akhir ini, akan dibandingkan performa dari dua metode yang digunakan untuk mengklasifikasikan data talasemia, yaitu K-Nearest Neighbor dan Naive Bayes. Data yang digunakan adalah 82 data pasien talasemia dan 68 data pasien non-talasemia dari Rumah Sakit Anak dan Bunda Harapan Kita, Jakarta Barat. Hasil akhir menunjukkan bahwa metode Naive Bayes memberikan nilai akurasi yang lebih besar dari K-Nearest Neighbor dalam mengklasifikasikan talasemia. Rata-rata akurasi Naive Bayes sebesar 99.775% dengan rata-rata waktu running 0.0554 detik dan rata-rata akurasi K-Nearest Neighbor adalah 97.142% dengan rata-rata waktu running 0.081 detik. Untuk nilai spesifikasi, keduanya memberikan performa yang sama, yaitu dari K-Nearest Neighbor diperoleh ketika K=3 yaitu sebesar 100% dan dari Naive Bayes sebesar 100%. Hasil rata-rata sensitivitas tertingi diberikan oleh Naive Bayes yaitu sebesar 99.59%, sedangkan K-Nearest Neighbor sebesar 96.25% untuk K=1.
ABSTRACT
Thalassemia is a disease caused by abnormalities in the hemoglobin. Thalassemia is a hereditary disease which the thalassemia gene carriers are parents of sufferers. In Indonesia, in 2015 it was found that the number of thalassemia cases reached 7,029 cases. Until now thalassemia has not been cured, but it can be recognized the nature of its carrier by screening. In this final project, the performance of the two methods will be compared to classify thalassemia data, namely K-Nearest Neighbor and Naive Bayes. The data used were 82 data on thalassemia patients and 68 data on non-thalassemia patients from Harapan Kita Children and Womans Hospital, West Jakarta. The final results show that the Naive Bayes method provides greater accuracy value than K-Nearest Neighbor in classifying thalassemia. The average accuracy of Naive Bayes is 99.775% with an average running time of 0.0554 seconds and the average accuracy of K-Nearest Neighbor is 97.142% with an average running time of 0.081 seconds. For specification values, both give the same performance. The result of specification values using K-Nearest Neighbor yield when K = 3 that is 100% and from Naive Bayes that is 100%. The highest average sensitivity results are given by Naive Bayes is 99.59%, while K-Nearest Neighbor is 96.25% for K = 1.
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Inna Apriantini
Abstrak :
Persalinan Caesar di Indonesia cenderung meningkat. Hasil Survei Demografi dan Kesehatan Indonesia (SDKI) tahun 2017 menunjukkan prevalensi tindakan Caesar pada persalinan adalah 17%. Berdasarkan data diduga bahwa peningkatan persalinan Caesar terkait dengan peningkatan Jaminan Kesehatan Nasional (JKN). Penelitian ini bertujuan untuk mendapatkan akurasi peran kepemilikan jaminan kesehatan terhadap pemilihan persalinan Caesar pada wanita umursubur (WUS) umur 15-49 tahun yang memiliki riwayat persalinan Caesar atau normal dalam kurun waktu lima tahun sebelum survei dengan menggunakan data sekunder SDKI 2017. Penelitian ini menggunakan analisis data dengan teknologi machine learning dengan analisa metode hierarki, metode k nearest neighbor dan regresi linier. Hasil penelitian mendapatkan pembentukan klaster optimal sebanyak 4. Didapatkan bahwa persalinan Caesar tertinggi berada pada klaster 2 yaitu Provinsi Jakarta, Bali dan Yogyakarta. Sedangkan penggunaan JKNterbesar berada pada klaster 1 sebesar 77%. Berdasarkan hasil grafik K nearest neigbor dan regresi linier didapatkan bahwa hipotesis ditolak sehingga penggunaan JKN tidak mempengaruhi penggunaan persalinan Caesar. Namun dalam penggunaannya KNN lebih baik dibandingkan regresi linier karena memiliki nilai RPSME lebih rendah. Hasil akurasi tertinggi didapatkan ketika nilai K= 16 yaitu sebesar 85.80% dengan nilai sensitivitas 99.80%.Maka disimpulkan bahwa dalam menganalisis persalinan Caesar dengan data SDKI 2017, KNN memiliki kemampuan 99.80% mendeteksi secara tepat yang merupakan ibu yang melakukan persalinan Caesar walaupun persalinan Caesar tidak dipengaruhi oleh penggunaan JKN. ......Cesarean deliveries in Indonesia are increasing. The results of the 2017 Indonesia Demographic and Health Survey (IDHS) DHS showed the prevalence of cesarean delivery in labor is 17%. The data suggest that the increase in cesarean delivery is related to the increase in national health insurance. This study aims to obtain the accuracy of the role of ownership of health insurance on the choice of cesarean delivery in women of childbearing aged 15-49 years who have a history of cesarean delivery or normal in the five years prior to the survey using secondary data from the 2017 IDHS. data analysis using machine learning technology with hierarchical analysis method, k nearest neighbor method and linear regression. The results showed that the optimal klaster formation was 4. It was found that the highest cesarean delivery was in klaster 2, namely the provinces of Jakarta, Bali and Yogyakarta. Meanwhile, the largest use of JKN is in klaster 1 at 77%. Based on the results of the K nearest neigbor graph and linear regression, it was found that the hypothesis was rejected so that the use of JKN did not affect the use of cesarean delivery. However, in its use, KNN is better than linear regression because it has a lower RPSME value. The highest accuracy results are obtained when the K = 16 value is 85.80% with a sensitivity value of 99.80%.So it was concluded that in analyzing cesarean deliveries using the 2017 IDHS data, KNN had the ability to accurately detect 99.80% of mothers who had cesarean deliveries even though cesarean deliveries were not affected by the use of JKN.
Depok: Fakultas Kesehatan Masyarakat Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Sheila Nuur Ditrie
Abstrak :
Penderita gangguan depresi semakin meningkat setiap tahunnya, terutama pada generasi muda. Hal ini membawa urgensi tentang pentingnya menjaga kesehatan mental, terlebih lagi WHO melaporkan bahwa depresi sangat mempengaruhi kualitas hidup dan menjadi penyebab dari meningkatnya risiko gangguan kesehatan lainnya. Kesalahan diagnosis seringkali terjadi pada depresi, maka dari itu sangat penting untuk mengembangkan pendekatan objektif untuk membantu dokter mendiagnosis depresi secara lebih efektif. Elektroensefalografi (EEG) merupakan teknologi berbasis sinyal otak yang dapat merekam aktivitas jaringan otak. Penelitian ini bertujuan untuk membuat program analisis gangguan depresi berbasis Machine Learning. Aplikasi Graphical User Interface (GUI) juga dibuat untuk mempermudah pengguna. Pemrosesan sinyal dilakukan dengan dua metode, yakni wavelet dan Power Spectral Density (PSD). Relative Power Ratio (RPR) dihitung sebagai fitur klasifikasi. Perhitungan dominansi juga dilakukan untuk mereduksi jumlah fitur. Fitur dengan dominansi tertinggi akan digunakan untuk membuat model klasifikasi Machine Learning. Pengklasifikasi yang digunakan adalah K-Nearest Neighbor (KNN) dengan cross validation. Akurasi tertinggi yang diperoleh mencapai 70% dengan metode wavelet dan 65% dengan metode PSD. ......The number of individuals suffering from depressive disorder (also known as major depressive disorder or MDD) is increasing every year, especially among the younger generations. This highlights the urgency of prioritizing mental health, especially considering the World Health Organization’s report that depression significantly affects the quality of life and increases the risk of other health disorders. Misdiagnosis often occurs in cases of depression, making it crucial of develop an objective approach to help doctors diagnose depression more affectively. Electroencephalography (EEG) is a brain signalbased technology that records brain network activity. This research aims to create a machine learning-based program for analyzing depressive disorders. Additionally, a Graphical User Interface (GUI) application is developed to facilitate users. Signal processing is performed using two methods, namely wavelet and Power Spectral Density (PSD). The Relative Power Ratio (RPR) is calculated as a classification feature. Dominance computation is also conducted to reduce the number of features, and the feature with highest dominance are used to create the Machine Learning classification model. The classifier used is K-Nearest Neighbor (KNN) with cross-validation. The highest accuracy achived is 70% with the wavelet method and 65% with the PSD method.
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Handoko Ramadhan
Abstrak :
PT Perusahaan Gas Negara (PGN) Tbk merupakan perusahaan yang memiliki pegawai sebanyak 1.383 orang pada Januari 2020 berdasarkan hasil wawancara dengan divisi Human Capital Management (HCM). Pengelolaan pegawai di PT PGN Tbk dibawah Direktorat SDM dan Umum yaitu pada divisi HCM. Salah satu departemen di HCM yaitu Human Capital Business Partner (HCBP) yang mempunyai tugas untuk memutasi, rotasi dan promosi. Tingginya frekuensi mutasi dan rotasi pegawai sebanyak 1.323 orang pada tahun 2018 dan 933 orang pada tahun 2019, menyebabkan sulitnya mendapatkan kandidat yang sesuai. PT PGN Tbk mempunyai aplikasi untuk mengelola data pegawai yaitu aplikasi HRMS (Human Resources Management System). Penelitian memiliki tujuan untuk menentukan model prediksi kandidat pegawai untuk menempati kekosongan jabatan di PT PGN Tbk menggunakan data 2017-2020 yang bersumber dari aplikasi HRMS. Penelitian ini menggunakan pendekatan mixed method. Pengumpul data menggunakan wawancara dengan analyst career & succession planning di PT PGN Tbk dan observasi terhadap aplikasi HRMS PT PGN Tbk yang berbasiskan Oracle Versi-12. Data dianalisis dengan membandingkan metode K-Nearest Neighbor (KNN), Naïve Bayes dan Random Forest untuk mencari model terbaik dalam prediksi pegawai. Hasil dari penelitian ini diharapkan dapat memberikan kontribusi terhadap PT PGN Tbk mengenai model prediksi untuk dapat membantu mengurangi subjektifitas dalam pemilihan kandidat melalui analisis data pada Aplikasi HRMS PT PGN Tbk. Hasil pada penelitian ini menunjukan bahwa metode Random Forest memiliki tingkat akurasi tertinggi yaitu sebesar 99% melalui uji validasi silang menggunakan 10-fold cross validation. ......PT Perusahaan Gas Negara (PGN) Tbk is a company with 1,383 employees as of January 2020 based on interviews with the Human Capital Management (HCM) division. Employee management at PT PGN Tbk under the Directorate of Human Resources and General Affairs, namely in the HCM division. One of the departments in HCM is Human Capital Business Partner (HCBP) which has the task to mutate, rotation and promotion. The high frequency of mutations and rotation of employees as many as 1,323 people in 2018 and 933 people in 2019, causing difficulty in getting suitable candidates. PT PGN Tbk has an application to manage employee data, namely the HRMS (Human Resources Management System) application. The research aims to determine the predictive model of employee candidates to occupy the vacancy at PT PGN Tbk using 2017-2020 data sourced from the HRMS application. This research uses mixed method approach. Data collectors use interviews with analyst career & succession planning at PT PGN Tbk and observation of PT PGN Tbk HRMS application based on Oracle Version-12. The data were analyzed by comparing K-Nearest Neighbor (KNN), Naïve Bayes and Random Forest methods to find the best model in employee prediction. The results of this research are expected to contribute to PT PGN Tbk regarding prediction model to be able to help reduce subjectivity in candidate selection through data analysis in PT PGN Tbk HRMS Application. The results in this research show that Random Forest method has the highest accuracy rate of 99% through cross validation test using 10-fold cross validation.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Anggrek Citra Nusantara
Abstrak :
Breast cancer can be detected using digital mammograms. In this research study, a system is designed to classify digital mammograms into two classes, namely normal and abnormal, using the k-Nearest Neighbor (kNN) method. Prior to classification, the region of interest (ROI) of a mammogram is cropped, and the feature is extracted using the wavelet transformation method. Energy, mean, and standard deviation from wavelet decomposition coefficients are used as input for the classification. Optimal accuracy is obtained when wavelet decomposition level 3 is used with the feature combination of mean and standard deviation. The highest accuracy, sensitivity, and specificity of this method are 96.8%, 100%, and 95%, respectively.
Depok: Faculty of Engineering, Universitas Indonesia, 2016
UI-IJTECH 7:1 (2016)
Artikel Jurnal  Universitas Indonesia Library
cover
Anggoro Gagah Nugroho
Abstrak :
Plat nomor merupakan suatu jenis identifikasi kendaraan bermotor. Setiap kendaraan bermotor yang beroperasi dijalanan diwajibkan untuk melengkapi kendaraannya dengan plat nomor atau Tanda Nomor Kendaraan Bermotor (TNKB) yang sesuai dengan kode wilayah, nomor registrasi dan masa berlaku. Plat nomor di Indonesia terdapat 3 warna yang dipakai yaitu hitam, merah dan kuning dengan masing masing warna untuk fungsi yang berbeda. Dengan jumlah kendaraan di Indonesia, sistem pengenalan plat nomor dibuat secara otomatis bisa di implementasikan untuk memudahkan berbagai hal dalam pendataan plat nomor diantaranya pengecekan plat nomor ketika di area parkir, menemukan kendaraan yang dicuri ataupun mobil yang melanggar lampu merah. Pada penelitian ini terdapat 2 metode yang sering digunakan untuk pengenalan plat nomor otomatis yaitu KNN (K-Nearest Neighbour) dan NN (Neural Network). Setelah dilakukan pengujian menggunakan 3 analisis uji yang sudah dilakukan oleh penulis, akurasi metode neural network berhasil mencapai 88,8% sedangkan pada K-Nearest Neighbor akurasinya mencapai 72,2%. Metode NN lebih baik daripada KNN pada pengujian kali ini disebabkan adanya modifikasi pada variable yang dapat membuat akurasi NN lebih baik daripada KNN. Sedangkan pada metode KNN tidak dapat merubah akurasi yang telah didapatkan. ......Number plate is a type of motor vehicle identification. Every motorized vehicle operating on the road is required to complete the vehicle with a license plate or Motor Vehicle Number (TNKB) that matches the area code, registration number and validity period. Number plates in Indonesia there are 3 colors used, namely black, red and yellow with each color for different functions. With the number of vehicles in Indonesia, the number plate recognition system is made automatically can be implemented to facilitate various things in number plate registration including checking license plates when in the parking area, finding stolen vehicles or cars that violate red lights. In this study there are 2 methods that are often used for automatic number plate recognition, namely K-Nearest Neighbor and NN (Neural Network). After testing using 3 test analyzes carried out by the author, the accuracy of the neural network method reached 88.8% while the K-Nearest Neighbor accuracy was 72.2%. The NN method is better than KNN in this test due to a modification in the variable that can make the accuracy of NN better than KNN. While the KNN method cannot change the accuracy that has been obtained.
Depok: Fakultas Teknik Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Wahyu Nuryaningrum
Abstrak :
Pesatnya perkembangan ekonomi menyebabkan kebutuhan manusia menjadi tidak terbatas. Usaha yang dapat dilakukan untuk pemenuhan kebutuhan hidup di masa yang akan datang adalah dengan melakukan investasi. Saham merupakan salah satu instrumen investasi dengan tingkat keuntungan yang menarik, namun memiliki risiko kerugian yang tinggi. Hal ini disebabkan oleh adanya pergerakan harga saham yang cenderung tak menentu selama periode waktu tertentu. Untuk meminimalkan risiko kerugian, perlu dilakukan prediksi pergerakan harga saham. Prediksi yang akurat akan membantu para investor dalam menentukan nilai saham di masa yang akan datang. Pada penelitian ini, dilakukan perbandingan untuk memprediksi pergerakan harga saham menggunakan tiga algoritma supervised machine learning yaitu Random Forest, Support Vector Regression (SVR) dan K- Nearest Neighbor (KNN) berdasarkan tingkat akurasinya. Sutau model dikatakan akurat jika memiliki nilai Root Mean Square Error (RMSE) dan Mean Absolute Error (MAE) yang lebih rendah. Pada penelitian ini, diperoleh hasil prediksi harga penutupan saham terbaik menggunakan metode Support Vector Regression dengan melihat rendahnya nilai RMSE dan MAE yang dihasilkan dibandingkan dengan dua metode lain. Dalam perhitungannya, penelitian ini menggunakan histori data harian dari website investing.com. periode Maret 2017 hingga Februari 2020 dari tiga perusahaan di Indonesia yang terdaftar dalam IDX30. ......The fast growth of economic development causes human needs to be immeasurable. One of the efforts that could be done to fulfill life needs in the future was Investation. Stock is one of the Investation instruments with interesting benefits but has high- risk loss caused by the unstable stock market trend between some period. For minimalizing the risky loss, the literati need to predicting the stock rate trend. The accurate prediction will help the investor in choosing a stock value in the future. In this study, the literati make a comparison to predict stock market trend with three kinds of algorithms supervised machine learning that are Randon Forest, Support Vector Regression (SVR), and K-Nearest Neighbor (KNN) based on their accurate level. A model could be said accurate just if they have a lower value of Root Mean Square Error (RMSE) and Mean Absolute Error (MAE). The best Stock Closing Price prediction will be obtained by the Support Vector Regression method and see how low the result of RMSE and MAE value is compared with another method. To calculate, the study uses a daily data history from investing.com website between March 2017 to February 2020 period. The object data is a three big company in Indonesia which listed in IDX30.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Restu Eka Firdaus
Abstrak :
Sistem pengenalan wajah telah banyak diaplikasikan dengan menggunakan berbagai metode, diantaranya: metode PCA, metode ICA, metode LDA, metode EP, metode EBGM, metode Kernel, metode 3-D Morphable, metode 3-D Face Recognition, metode Bayesian Framework, metode HMM, metode SVM, dan sebagainya. Pada penelitian ini digunakan metode Local Binary Pattern LBP untuk melakukan ekstraksi fitur citra wajah, serta metode SVM dan KNN untuk mengukur tingkat akurasi sistem pengenalan wajah. Data yang digunakan pada penelitian ini yaitu citra wajah 25 mahasiswa Matematika Universitas Indonesia, masing-masing individu diambil 10 citra wajah yang berbeda terdiri dari 5 citra wajah menggunakan kacamata dan 5 citra lainnya tidak menggunakan kacamata, serta diambil dari sudut yang berlainan. Berdasarkan pengujian yang telah dilakukan, metode KNN dengan memperoleh tingkat akurasi terbaik yaitu sebesar 96.20 pada iterasi 100 dan 90 data training. Hal ini menunjukkan metode KNN lebih baik dibandingkan dengan metode SVM yang hanya memperoleh tingkat akurasi sebesar 94.80 pada iterasi 100 dan 90 data training.
Face recognition has been widely applied using various methods, that is PCA, ICA, LDA, EP, EBGM, Kernel, 3 D Morphable, 3 D Face Recognition, Bayesian Framework, HMM, SVM, etc. In this research, the Local Binary Pattern LBP method is used to perform feature extraction of a facial image, and to measure the accuracy level of face recognition used SVM and knn method. The data used in this research are face images of 25 mathematics students of University of Indonesia, each individual took 10 different facial images consisting of 5 face images are using glasses with 5 different angles and 5 other images aren 39 t using glasses that also taken from the same 5 different angles. Based on the tests, KNN method with K 1 obtained the best accuracy of 96.20 at 100 iterations and 90 training data. This result shows the KNN method is better than the SVM method which only obtained 94.80 at 100 iterations and 90 of training data.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aulya Khatulistivani
Abstrak :
Pada sistem parkir yang ada saat ini, proses pengecekan plat nomor atau Tanda Nomor Kendaraan Bermotor TNKB dilakukan dengan mencocokkan plat nomor melalui foto yang diambil saat pengguna masuk ke area parkir. Hasil pengenalan plat nomor kemudian diinput ke komputer dengan cara diketik. Proses yang dilakukan secara manual oleh operator ini memakan waktu yang relatif lama. Tugas akhir ini mengembangkan pengenalan plat nomor otomatis untuk mengatasi masalah tersebut. Pengenalan plat nomor otomatis merupakan teknologi yang memudahkan ekstraksi karakter-karakter pada plat nomor. Pengembangan sistem parkir ini menggunakan OpenCV sebagai pustaka pengolah citra, algoritma KNN K-Nearest Neighbour untuk Optical Character Recognition, dan sistem basis data untuk sistem parkir. Berdasarkan hasil pengujian, kombinasi nilai variabel block size dan weight terbaik untuk proses thresholding dalam pengenalan plat nomor adalah b=71 dan w=20 dengan hasil akurasi segmentasi karakter sebesar 89, akurasi rekognisi sebesar 82, dan jumlah rekognisi yang tepat 100 sebesar 26. Sistem dapat membaca plat nomor dengan baik pada jarak optimal 60 cm dengan akurasi segmentasi karakter sebesar 89, akurasi rekognisi sebesar 79, dan jumlah rekognisi yang tepat 100 sebesar 26. Resolusi input gambar juga memengaruhi proses pengenalan plat nomor. Resolusi yang optimal untuk rekognisi adalah 1024 x 768 dengan hasil akurasi segmentasi karakter sebesar 89, akurasi rekognisi keseluruhan sebesar 81, jumlah rekognisi yang tepat 100 sebesar 26, dan dengan rata-rata waktu pemrosesan selama 0,174 detik. Akurasi rekognisi plat nomor juga diperngaruhi oleh faktor lain seperti pencahayaan dan kondisi plat nomor apakah rusak atau tidak, tertutup sesuatu atau tidak . Selain itu, kondisi plat nomor yang ideal diperlukan untuk pengenalan plat nomor otomatis secara optimal. Secara keseluruhan, sistem parkir otomatis memiliki akurasi rekognisi yang baik. ......In current parking system, number plate checking is done by matching it through the photo taken when user enters the parking area. The operator then types the recognised number plate into computer. The process, which is done manually by operator, takes a relatively long time. This thesis develops an automatic license plate recognition to overcome the problem. Automatic license plate recognition is a technology which makes computer able to recognize characters in a license plate. The development of the system uses OpenCV as image processing library, KNN algorithm for Optical Character Recognition OCR, and database system for parking data. Based on the test result, the combination of the best block size and weight value for the thresholding process in the recognition of the number plate is b 71 and w 20 with character segmentation accuracy of 89, recognition accuracy of 82, and the number of fully recognized number plate of 1. The system can read the number plate well at an optimal distance of 60 cm with character segmentation accuracy 89, recognition accuracy of 79, and fully recognized number plate 26. Image input resolution also affects the number plate recognition process. The optimal resolution for recognition is 1024 x 768 with character segmentation accuracy of 89, overall segmentation accuracy of 81, the number of fully recognized number plate of 26, and with average processing time of 0.174 seconds. The accuracy of plate number recognition is also affected by other factors such as lighting and the condition of the number plate whether it is damaged or not, obstructed by something or not. In addition, the ideal number plate conditions are required for optimal number plate recognition. Overall, the automated parking system has a good recognition accuracy.
Depok: Fakultas Teknik Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Geraldine Immanuel Tangyong
Abstrak :
Clustering merupakan salah satu metode pengolahan data yang bekerja dengan mengelompokkan objek-objek yang memiliki kemiripan ke dalam beberapa kelompok. Salah satu metode dari clustering adalah metode Ordering Points to Identify the Clustering Structure (OPTICS) yang adalah metode turunan dari metode Density Based Spatial Clustering of Application with Noise (DBSCAN). DBSCAN memiliki dua parameter, yaitu epsilon dan MinPts. Parameter ini mengakibatkan DBSCAN kurang bisa beradaptasi terhadap variasi densitas data. Karena itu, OPTICS hadir untuk mengatasi masalah tersebut dengan parameter core distance dan reachability distance. Tujuan dari penelitian ini adalah mengkaji metode OPTICS dan menerapkannya pada data sintetis dengan missing value serta pada data real, dengan data yang digunakan adalah data Socio-Economic dengan 167 observasi. Dari hasil pengkajian diketahui bahwa jika suatu data memiliki proporsi missing value lebih dari 15%, maka nilai akurasi dianggap tidak baik. Selanjutnya, dilakukan penerapan terhadap data Socio-Economic dan diperoleh 3 cluster. Cluster 1 memiliki jumlah anggota terbanyak dan cenderung memiliki skor terendah pada banyak variabel dibanding cluster lainnya dan dapat dilihat bahwa anggota dari cluster 1 banyak terdiri dari negara-negara berkembang. Cluster 2 cenderung memiliki skor tertinggi dan negara-negara di cluster 2 merupakan negara-negara maju. Cluster 3 banyak berisi negara campuran, baik negara berkembang maupun negara maju. ......Clustering is a data processing technique that works by grouping objects that have similarities into different groups. One method of clustering is the Ordering Points to Identify the Clustering Structure (OPTICS) method, a derivative method of the Density Based Spatial Clustering of Application with Noise (DBSCAN) method. DBSCAN has two kinds of parameters, epsilon and MinPts. These parameters cause DBSCAN to not be able to adapt fully to arbitrary data forms. Therefore, OPTICS is here to solve this problem with the parameters of core distance and reachability distance. The purpose of this study is to examine the OPTICS method and apply it to synthetic with missing value and real data, using the Socio-Economic data with 167 observations. We can conclude that if a data has a missing value proportion of more than 15%, then the accuracy value is considered not good. Furthermore, the Socio-Economic data was applied and obtained 3 clusters. Cluster 1 has the largest number of members and have the lowest scores on many variables, which consists mostly of developing countries. Cluster 2 tends to have the highest score whereas most coming from developed countries. Cluster 3 contains many mixed countries, both developing and developed countries.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2   >>