Hasil Pencarian

Ditemukan 20 dokumen yang sesuai dengan query

Ivan Noverlianto Tanawi

Implementasi Support Vector Regression Untuk Memprediksi Jumlah Insiden Demam Berdarah Dengue di DKI Jakarta = Implementation of Support Vector Regression for Predicting Dengue Incidences Number in DKI Jakarta

"Demam Berdarah Dengue (DBD) disebabkan oleh virus dengue yang disebarkan oleh nyamuk Aedes aegypti dan Aedes albopictus. Menurut WHO, sebagai negara yang berada di daerah tropis, Indonesia adalah negara yang berisiko DBD tinggi. DBD dapat menyebar dari penderita DBD ke orang yang sehat melalui gigitan nyamuk yang telah terinfeksi virus dengue. Faktor cuaca yang terdiri dari temperatur, kelembaban, dan curah hujan mempunyai pengaruh terhadap jumlah insiden DBD. Dengan memprediksi jumlah insiden DBD, diharapkan pemerintah dan masyarakat lebih siap menangani DBD ketika jumlah insiden DBD diprediksi tinggi jumlahnya.

Pada tugas akhir ini, jumlah insiden DBD diprediksi dengan support vector regression, dengan jumlah insiden dan faktor cuaca sebelumnya yang terdiri dari temperatur, kelembaban, dan curah hujan sebagai variabel prediktor. Fungsi kernel yang digunakan adalah kernel linear dan kernel gaussian radial basis function (radial). Variabel prediktor ditentukan dengan mencari time lag dari masing-masing variabel prediktor terhadap jumlah insiden menggunakan korelasi silang. Model yang dibentuk dievaluasi dengan Root Mean Squared Error dan Mean Absolute Error. Pada tugas akhir ini, support vector regression dengan kernel linear memberikan performa yang lebih baik daripada kernel radial.

Dengue fever is a disease caused by dengue virus, which is spread by Aedes aegypti and Aedes albopictus mosquitoes. According to WHO, as a tropical country, Indonesia is a country at risk for dengue. Dengue can spread to other people by mosquitoes bite. Weather factors, such as temperature, humidity, and rainfall have effects on the number of dengue incidences. It is important to predict the number of incidences so that the government and people will be ready to prevent a dengue outbreak when the number of incidences is predicted high.
In this final paper, number of dengue incidences in DKI Jakarta is predicted using support vector regression, with weather and the previous number of incidences as predictor variables. Linear and gaussian radial basis function kernel are used. These predictor variables are determined by analyzing the time lag between each predictor variables and the number of incidences by using cross correlation. Models for prediction are evaluated by Root Mean Squared Error and Mean Absolute Error. The result shows that support vector regression with linear kernel have better performance than support vector regression with gaussian radial basis function kernel for predicting dengue incidences number."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Fakhrul Agustriwan

Model peramalan trafik internet dengan kombinasi algoritma self organizing map dan support vector regression = Internet traffic forecasting model by combining self organizing map and support vector regression algorithms / Fakhrul Agustriwan

"ABSTRAK

Peramalan trafik internet merupakan salah satu pendekatan yang dapat diterapkan oleh penyedia jasa internet dalam menjaga dan meningkatkan kualitas pelayanan internet yang ditawarkan. Pada penelitian ini, digunakan metode peramalan berupa kombinasi algoritma self organizing map (SOM) dan support vector regression (SVR). Metode SOM digunakan untuk membagi data historis trafik internet secara keseluruhan ke dalam beberapa cluster, sedangkan metode SVR digunakan untuk membentuk model peramalan pada setiap cluster yang terbentuk. Hasil peramalan data trafik internet pada penelitian ini menunjukkan bahwa model peramalan dengan metode SOM-SVR dapat memberikan prediksi yang lebih akurat terkait nilai error yang lebih kecil dibandingkan dengan metode SVR tunggal.

ABSTRACT

Traffic internet forecasting is one kind of approaches which can be implemented by internet service provider in order to keep and improve the offered internet service quality. This research uses the combination of self organizing map (SOM) and support vector regression (SVR) algorithm as forecasting method. SOM is first used to decompose the whole historical data of traffic internet into some clusters, while SVR is used to build a forecasting model in each formed cluster. The forecasting results of internet traffic data in this research show that the forecasting model by using SOM-SVR method can give more accurate prediction in terms of smaller error value compared to single SVR method.

2015

S59440

UI - Skripsi Membership Universitas Indonesia Library

Rizki Laksmana Pratama

Implementasi Support Vector Regression (SVR) dan Convolutional Neural Network (CNN) untuk Sistem Prediksi Turbiditas Air Berbasis Citra Ponsel = Implementation of Support Vector Regression (SVR) and Convolutional Neural Network (CNN) for Mobile Image-based Water Turbidity Prediction System

"Turbiditas merupakan salah satu indikator yang dapat digunakan untuk menilai kualitas air. Turbiditas dapat diukur menggunakan instrumen konvensional seperti turbidimeter, spektrofotometer, dan nefelometri visual. Namun, semua instrumen tersebut memiliki kekurangannya masing-masing, seperti biaya yang relatif tinggi dan kurang efisien. Pada penelitian ini diusulkan metode pengukuran yang lebih terjangkau dan efisien dengan memanfaatkan kamera ponsel, serta model regresi support vector regression dan EfficientNet-B0 berbasis convolutional neural network sebagai instrumen pengukuran. Akuisisi citra dilakukan di dua lingkungan. Lingkungan 1 didefinisikan sebagai lingkungan dengan cahaya langsung yang menyinari sampel, mengikuti prinsip turbidimetri, sedangkan lingkungan 2 didefinisikan sebagai lingkungan dengan pencahayaan yang bergantung hanya kepada cahaya sekitar dengan intensitas cahaya yang tak tentu. Citra yang telah diakuisisi oleh ponsel melalui berbagai proses prapengolahan data seperti segmentasi, augmentasi, penerapan filter Gaussian, dan ekstraksi fitur saturasi dan tekstur sebelum diteruskan ke model regresi. Dari hasil evaluasi didapatkan kesimpulan bahwa model EfficientNet-B0 lebih unggul dibandingkan dengan support vector regresssion dengan fitur saturasi, tekstur maupun gabungan. Model EfficientNet-B0 mendapatkan nilai R2 sebesar 0.992, MAE sebesar 2.474 dan MSE sebesar 10.669 untuk citra lingkungan 1, dan nilai R2 sebesar 0.97, MAE sebesar 3.333 dan MSE sebesar 29.137 untuk citra lingkungan 2.

Turbidity is an indicator that can be used to assess water quality. Turbidity can be measured using conventional instruments such as turbidimeter, spectrophotometer, and visual nephelometry. However, all of these instruments have their respective drawbacks, such as relatively high costs and inefficient. In this study, a more affordable and efficient measurement method is proposed by utilizing a cellphone camera, as well as a support vector regression and EfficientNet-B0 model based on convolutional neural network as a measurement instrument. Image acquisition will be carried out in two environments. Environment 1 is defined as an environment with direct light shining on the sample, following the principle of turbidimetry, while environment 2 is defined as an environment in which the illumination depends on the ambient light with an indeterminate light intensity. The image that has been acquired by the cellphone will go through various data preprocessing processes such as segmentation, augmentation, application of Gaussian filters, and extraction of saturation and texture features before being forwarded to the regression model. From the evaluation results, it can be concluded that the EfficientNet-B0 model is superior to the support vector regression with saturation, texture, or combined features. The EfficientNet-B0 model gets an R2 value of 0.992, an MAE of 2.474 and an MSE of 10,669 for environment 1 image, and an R2 value of 0.97, an MAE of 3.333 and an MSE of 29,137 for environment 2 image."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Nisa’u Farhatin

Estimasi Dosis Terapi Radiasi Kanker Paru Teknik Intensity Modulated Radiation Therapy (IMRT) menggunakan Model Support Vector Regression (SVR) = Radiation Therapy Dose Estimation for Lung Cancer Intensity Modulated Radiation Therapy (IMRT) Technique using Support Vector Regression (SVR) Model

"Distribusi dosis yang optimal dalam treatment planning system (TPS) sangat penting sebelum diterapkan pada pasien radioterapi. Namun, TPS masih menggunakan metode optimisasi yang memakan waktu dan bergantung pada pengguna. Tujuan dari penelitian ini adalah untuk mengevaluasi model estimasi dosis otomatis, support vector regression (SVR), dan membandingkannya dengan dosis pasien kanker paru hasil perencanaan klinik. Enam puluh pasien yang terapi dengan teknik intensity modulated radiation therapy (IMRT) digunakan dalam penelitian ini. Distribusi dosis target dievaluasi berdasarkan nilai conformity index (CI), homogenitas dosis dievaluasi dengan homogeneity index (HI), sedangkan dosis rata-rata dan dosis maximum digunakan untuk mengevaluasi organ at risk (paru kanan, paru kiri, jantung, dan spinal cord). Analisis statistik dilakukan dengan menggunakan uji Wilcoxon. Nilai p < 0,05 menunjukkan adanya perbedaan signifikan antara kedua dataset. Rata-rata CI model SVR dan klinik masing-masing adalah dan Rata-rata HI untuk SVR dan klinik adalah dan . Uji Wilcoxon menunjukkan tidak ada perbedaan signifikan secara statistik antara kedua hasil. Dosis maximum paru kanan menunjukkan perbedaan signifikan secara statistik (p=0,032), sedangkan dosis rata-rata dan dosis maximum OAR lain tidak menunjukkan perbedaan signifikan secara statistik. Berdasarkan hasil penelitian menunjukkan bahwa tidak ada perbedaan yang signifikan antara kedua strategi tersebut, kecuali pada dosis maximum paru kanan. Model tersebut dapat diimplementasikan secara klinik untuk menghasilkan distribusi dosis yang dapat digunakan sebagai acuan untuk memastikan rencana idealis yang digunakan

Optimal dose distribution in the treatment planning system (TPS) is crucial before being applied to radiotherapy patients. However, TPS still uses optimization methods that are time-consuming and user-dependent. This study aimed to evaluate the automatic dose estimation model, support vector regression (SVR), and compare it with the clinically planned dose of lung cancer patients. Sixty patients treated with intensity-modulated radiation therapy (IMRT) were used as the objects in this study. The target dose distribution was evaluated based on the conformity index (CI), and dose homogeneity was evaluated with the homogeneity index (HI), while the mean and maximum doses were used to evaluate organs at risk (right lung, left lung, heart, and spinal cord). Statistical analysis was performed using the Wilcoxon test. A p-value of <0,05 indicates a significant difference between the two datasets. The mean CI of the SVR and clinical are and The mean HI for SVR and clinical was adalah and 0,083±0,030. the Wilcoxon test showed no statistically significant difference between the two results. The maximum right lung dose showed a statistically significant difference (p=0,032), while the mean dose and maximum dose of other OARs did not show a statistically significant difference. The results of the study showed no significant difference between the two strategies, except for the maximum right lung dose. The model can be implemented clinically to produce a dose distribution that can be used as a reference to ensure the idealistic plan."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Annisa Zahra

Model Prediksi Usia Biologis Menggunakan Metode Support Vector Regression dan Principal Component Analysis pada Biomarker Klinis = Biological Age Prediction Model Using Support Vector Regression and Principal Component Analysis Methods on Clinical Biomarkers

"Penuaan adalah proses alami yang secara bertahap menurunkan kondisi fisik dan menyebabkan kemunculan berbagai penyakit, yang pada akhirnya dapat mengurangi rentang hidup makhluk hidup serta berujung pada kematian. Dalam konteks ini, usia biologis berperan sebagai indikator penting yang mampu mengevaluasi proses penuaan dan prediksi penyakit lebih efektif dibandingkan dengan usia kronologis. Hal ini dikarenakan usia biologis juga memperhatikan kondisi fisiologis individu, bukan hanya mengukur lamanya hidup seseorang sejak lahir. Penelitian ini berfokus pada proses penuaan alami yang tidak dipengaruhi oleh penyakit. Dengan demikian, model ini dapat dijadikan alat untuk mengidentifikasi individu yang jalur penuaannya menyimpang dari jalur penuaan yang sehat. Penelitian ini menggunakan metode Support Vector Regression dan Principal Component Analysis untuk memprediksi usia biologis berdasarkan biomarker klinis yang berkontribusi terhadap proses penuaan. Data yang digunakan pada penelitian ini adalah data medis yang berasal dari Kementerian Kesehatan Republik Indonesia. Pada dataset, dilakukan data preprocessing yang meliputi pengubahan tipe data, penghapusan kolom yang tidak digunakan, penyaringan usia partisipan, pembentukan data sintetis, dan pemisahan dataset pria dan wanita. Selanjutnya, dilakukan feature selection, uji multikolinearitas, dan pembentukan model menggunakan metode Support Vector Regression dan Principal Component Analysis. Performa dari model yang dibentuk, dievaluasi menggunakan Root Mean Squared Error dan Coefficient of Determination. Untuk model yang menggunakan metode Support Vector Regression, didapatkan nilai RMSE = 5, 228 dan r2 = 0, 807 pada model pria, serta nilai RMSE = 1, 798 dan r2 = 0, 959 pada model wanita. Sementara itu, model yang menggunakan metode Principal Component Analysis didapatkan nilai RMSE = 6, 835 dan r2 = 0, 751 pada model pria dan nilai RMSE = 5, 35 dan r2 = 0, 874 pada model wanita. Berdasarkan analisis kinerja model yang dilakukan pada penelitian ini, model dengan metode Support Vector Regression lebih unggul dalam memprediksi usia biologis dibandingkan dengan metode Principal Component Analysis.

Aging is a natural process that gradually deteriorates physical condition and leads to the emergence of various diseases, ultimately reducing the lifespan of living beings and leading to death. In this context, biological age acts as an important indicator capable of evaluating the aging process and predicting diseases more effectively than chronological age. This is because biological age also considers an individual's physiological condition, not just measuring the length of time of person's life since birth. This research focuses on the natural aging process that is not influenced by disease. Thus, this model can be used as a tool to identify individuals whose aging path deviates from a healthy aging trajectory. This study uses Support Vector Regression and Principal Component Analysis methods to predict biological age based on clinical biomarkers that contribute to the aging process. The data used in this study are medical data from the Ministry of Health of the Republic of Indonesia. In the dataset, data preprocessing is performed, which includes changing data types, removing unused columns, filtering participant ages, forming synthetic data, and separating datasets for men and women. Next, feature selection, tests of multicollinearity, and model formation using the Support Vector Regression and Principal Component Analysis methods are conducted. The model formed is evaluated using Root Mean Squared Error and Coefficient of Determination. For the model using the Support Vector Regression method, RMSE=5,228 and r^2=0,807 were obtained for the men model, while an RMSE=1,798 and r^2=0,959 were obtained for the women model. Conversely, for the model using the Principal Component Analysis method, an RMSE=6,835 and r^2=0,751 were obtained for the men model, and an RMSE=5,35 and r^2=0,874 for the women model. Based on the performance analysis conducted in this study, the model using the Support Vector Regression method outperforms the Principal Component Analysis method in predicting biological age."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Angelica Patricia Djaya Saputra

Prediksi Usia Biologis Menggunakan Metode Support Vector Regression dan Klemera-and-Doubal pada Data Pemeriksaan Medis = Biological Age Prediction Using the Support Vector Regression and Klemera-and-Doubal Methods on Medical Examination Data

"Penuaan biologis mencerminkan kondisi kesehatan fisik yang sebenarnya karena menilai fungsi organ dan sistem tubuh yang sebenarnya pada setiap individu, berbeda dengan usia kronologis. Penelitian ini mengeksplorasi prediksi usia biologis menggunakan metode Support Vector Regression (SVR) dan Klemera-and-Doubal Method (KDM), yang berfokus pada pengaruh biomarker dan faktor eksternal pada proses penuaan. Pembangunan model memanfaatkan data pemeriksaan medis dari Kementerian Kesehatan Indonesia pada tahun 2011 dimana keterbaharuan dari penelitian ini adalah melibatkan semua fitur yang berperngaruh terhadap usia biologis, termasuk faktor eksternal, tidak hanya biomarker saja. Kemudian, dilakukan pemanfaatan seluruh dataset tanpa membedakan subjek sehat dan tidak sehat. Pada dataset dilakukan data preprocessing agar dataset siap digunakan dengan melakukan filtering usia di atas 30 tahun, pemisahan dataset pria dan wanita, menghapus fitur yang tidak relevan, mengubah tipe data yang tidak sesuai, mengidentifikasi dan melakukan penanganan missing value serta outliers, dan melakukan encoding untuk data beripe kategorikal. Kemudian, dilakukan feature selection dengan menggunakan Spearman’s rank Coefficient Corelation dan pembangunan model SVR dan KDM. Hasil penelitian menunjukkan bahwa terpilih 5 fitur untuk pria dan 6 fitur untuk wanita yang digunakan untuk membangun model SVR dan KDM. KDM menunjukkan performa evaluasi yang cukup baik dalam interpretasi variasi data dengan skor performa RMSE 1,39; R2 0,97; dan Adjusted R2 0,97 untuk pria dan RMSE 1,00; R2 0,99; dan Adjusted R2 0,99 untuk wanita. Metode ini lebih unggul daripada SVR yang cenderung menunjukkan performa yang kurang memuaskan dimana memiliki skor performa RMSE 6,36; R2 0,44; dan Adjusted R2 0,36 untuk pria dan RMSE 5,90; R2 0,57; dan Adjusted R2 0,53 untuk wanita. Berdasarkan hasil analisis dari berbagai teknik analisis yang dilakukan (analisis evaluasi performa, analisis hubungan usia kronologis dengan usia biologis, dan analisis evaluasi dengan melihat pola hasil estimasi) terlihat bahwa metode KDM lebih unggul dalam memprediksi usia biologis dibandingkan dengan SVR, terutama dalam hal konsistensi dan akurasi. Selain itu, analisis hubungan setiap fitur dengan usia biologis untuk tiap model menggambarkan pengaruh fitur-fitur tersebut terhadap fungsi organ tubuh seseorang.

The biological aging reflects the actual physical health condition as it assesses the real function of organs and body systems in each individual, different from chronological age. This research explores the prediction of biological age using the Support Vector Regression (SVR) method and the Klemera-and-Doubal Method (KDM), focusing on the influence of biomarkers and external factors on the aging process. The model development utilized medical examination data from the Indonesian Ministry of Health in 2011, where the novelty of this research is involving all features that affect biological age, including external factors, not just biomarkers. Then, the entire dataset was utilized without distinguishing between healthy and unhealthy subjects. In the dataset, data preprocessing was performed to make the dataset ready to use by filtering ages above 30 years, separating datasets for men and women, removing irrelevant features, changing inappropriate data types, identifying and handling missing values and outliers, and encoding for categorical data. Subsequently, feature selection was conducted using Spearman's Rank Coefficient Correlation, and then the SVR and KDM models were built. The research results showed that 5 features for men and 6 features for women were selected to build the SVR and KDM models. KDM showed fairly good evaluation performance in interpreting data variations with performance scores of RMSE 1.39, R^2 0.97, and Adjusted R^2 0.97 for men and RMSE 1.00, R^2 0.99, and Adjusted R^2 0.99 for women. This method outperformed SVR, which tended to show less satisfactory performance with performance scores of RMSE 6.36, R^2 0.44, and Adjusted R^2 0.36 for men and RMSE 5.90, R^2 0.57, and Adjusted R^2 0.53 for women. Based on the analysis results from various techniques performed (performance evaluation analysis, analysis of the relationship between chronological age and biological age, and evaluation analysis by looking at the pattern of estimation results), it appears that the KDM method is superior in predicting biological age compared to SVR, especially in terms of consistency and accuracy. In addition, the analysis of the relationship of each feature with biological age for each model illustrates the influence of these features on the organ function of an individual."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Kayla Calista Ayal

Implementasi Metode Support Vector Regression dan Light Gradient Boosting Machine dalam Memprediksi Usia Biologis pada Data Pemeriksaan Medis = Implementation of Support Vector Regression and Light Gradient Boosting Machine Methods for Predicting Biological Age from Medical Examination Data

"Usia biologis mengukur penuaan individu berdasarkan kondisi fisik dan fungsi organ. Meskipun banyak penelitian telah dilakukan untuk memprediksi usia biologis dengan berbagai metode, penerapan metode machine learning masih memiliki ruang untuk penelitian lebih lanjut. Penelitian ini mengimplementasikan dua metode machine learning dengan pendekatan yang berbeda, yaitu metode Support Vector Regression (SVR) dan Light Gradient Boosting Machine (LGBM) dalam memprediksi usia biologis menggunakan data pemeriksaan medis Kementerian Kesehatan tahun 2011 yang mencakup 5960 subjek dan 41 fitur. Proses preprocessing meliputi penyaringan usia kronologis > 30 tahun, pemisahan data berdasarkan jenis kelamin, penanganan missing values dan outlier, serta data encoding. Feature selection menggunakan koefisien korelasi Spearman menghasilkan 8 fitur berbeda untuk setiap jenis kelamin. Data dibagi dengan 90% untuk pelatihan dan 10% untuk pengujian, serta dilakukan tuning hyperparameter menggunakan GridSearchCV. Penelitian ini menggunakan metrik RMSE dan adjusted R-squared, yang dipilih berdasarkan relevansinya dengan tujuan penelitian. Hasil menunjukkan LGBM lebih unggul dari SVR dengan RMSE 7,2064 tahun dan adjusted R-squared 33,36% pada pria, serta RMSE 7,1475 tahun dan adjusted R-squared 22,16% pada wanita. Analisis korelasi menunjukkan hubungan yang wajar antara usia biologis dan usia kronologis serta korelasi yang cukup antara usia biologis dengan biomarker tekanan sistolik dan status hipertensi pada pria, serta tekanan sistolik dan kolesterol pada wanita. Analisis korelasi menunjukkan hubungan signifikan antara usia biologis dengan usia kronologis dan beberapa biomarker. Secara keseluruhan, LGBM lebih efektif dalam memprediksi usia biologis dibandingkan SVR. Hasil dari penelitian diharapkan dapat diaplikasikan dalam kehidupan sehari-hari, seperti membantu perusahaan asuransi menilai kelayakan klaim berdasarkan prediksi usia biologis, serta mendukung keputusan di bidang kesehatan preventif.

Biological age measures an individual's aging based on physical condition and organ function. Although numerous studies have been conducted to predict biological age using various methods, there is still room for further research in the application of machine learning techniques. This study implements two machine learning methods with different approaches, namely Support Vector Regression (SVR) and Light Gradient Boosting Machine (LGBM), to predict biological age using medical examination data from the Ministry of Health in 2011, covering 5960 subjects and 41 features. The preprocessing steps include filtering chronological age > 30 years, segregating data by gender, handling missing values and outliers, and data encoding. Feature selection using Spearman correlation coefficients resulted in 8 different features for each gender. The data was split into 90% for training and 10% for testing, with hyperparameter tuning performed using GridSearchCV. This study used RMSE and adjusted R-squared metrics, selected based on their relevance to the research objectives. The results show that LGBM outperformed SVR with an RMSE of 7.2064 years and an adjusted R-squared of 33.36% for men, and an RMSE of 7.1475 years and an adjusted R-squared of 22.16% for women. Correlation analysis revealed a significant relationship between biological age and chronological age, as well as a reasonable correlation between biological age and biomarkers such as systolic blood pressure and hypertension status in men, and systolic blood pressure and cholesterol in women. Overall, LGBM proved to be more effective in predicting biological age compared to SVR. The results of this study are expected to be applicable in everyday life, such as assisting insurance companies in evaluating claim eligibility based on biological age predictions, as well as supporting decision-making in preventive healthcare."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Nadia Hartini Kusumawijaya

Komparasi Kinerja Metode Random Forest Regression dengan Metode Support Vector Regression untuk Memprediksi Usia Biologis pada Data Pemeriksaan Medis = Comparison of the Performance of the Random Forest Regression Method with the Support Vector Regression Method for Predicting Biological Age on Medical Examination Data

"Penuaan adalah salah satu faktor utama resiko terjadinya penyakit dan kematian. Laju

penuaan individu dengan usia kronologis yang sama terbukti bervariasi. Maka dari

itu, muncul kebutuhan untuk alat pengukuran penuaan yang lebih akurat, robust, dan

dapat diandalkan dibandingkan usia kronologis, yakni usia biologis. Pada penelitian

ini, penulis membangun model menggunakan Metode Random Forest Regression (RF)

dan Metode Support Vector Regression (SVR) untuk memprediksi umur biologis pada

data pemeriksaan medis, menilai dan mengevaluasi hasil kinerjanya, serta melakukan

komparasi kinerja kedua metode. Terkait metode yang digunakan, Metode RF adalah

metode yang mengaplikasikan Teknik Ensemble Learning dengan cara menggabungkan

beberapa decision tree untuk menghasilkan prediksi. Sedangkan, Metode SVR adalah

metode yang berkerja dengan cara membangun hyperplane atau kumpulan hyperplane

dalam ruang berdimensi tinggi yang dapat digunakan untuk regresi linier atau nonlinier.

Dataset yang digunakan adalah data medis yang berasal dari Kementrian Kesehatan

Republik Indonesia. Pada dataset dilakukan data preprocessing, yakni data diproses pada

aspek missing values handling, encoding, dan outliers detection and outliers handling.

Kemudian, dilakukan feature selection menggunakan Spearman’s Rank Correlation

Coefficient. Setelah itu, dilakukan pembangunan model dengan Metode RF dan model

dengan Metode SVR secara terpisah untuk masing - masing jenis kelamin. Terakhir,

performa model dievaluasi dan dibandingkan kinerjanya menggunakan metrik evaluasi

Root Mean Square Error (RMSE), Coefficient of Determination (R2), Adjusted R2, dan

running time. Metode RF menggunakan hyperparameter terbaik {’max depth’: 15,

’n estimators’: 1150} untuk dataset pria, dan {’max depth’: 15, ’n estimators’: 1250}

untuk dataset wanita. Sedangkan, Metode SVR menggunakan hyperparameter terbaik

{’C’: 2,’epsilon’: 0,2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’tol’: 0,005} untuk dataset pria,

dan {’C’: 3, ’epsilon’: 0,2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’tol’: 0,005} untuk dataset

wanita. Metode RF memiliki kinerja yang cukup baik, dengan nilai RMSE = 7,532; R2

= 0,403; Adjusted R2 = 0,351; running time = 0,154 untuk pria dan RMSE = 6,889;

R2 = 0,340; Adjusted R2 = 0,264; running time = 0,179 untuk wanita. Selain itu, SVR

juga memiliki performa yang cenderung sama namun sedikit lebih buruk, dengan nilai

RMSE = 7,692; R2 = 0,376; Adjusted R2 = 0,321; running time = 0,035 untuk pria dan

RMSE = 6,905; R2 = 0,337; Adjusted R2 = 0,306; running time = 0,080 untuk wanita.

Berdasarkan analisis kinerja model yang dilakukan pada penelitian ini model yang

dibangun dengan Metode Random Forest Regression lebih unggul dalam memprediksi

usia biologis dibandingkan dengan Metode Support Vector Regression.

Aging is one of the main risk factors for disease and death. The aging rate of individ- uals of the same chronological age has been shown to vary. So therefore, a need arises for a more accurate, robust, and reliable aging measurement tool than chronological age, namely biological age. In this research, the author build a model using the Random For- est Regression (RF) Method and the Support Vector Regression (SVR) Method to predict biological age from patient clinical data, assess and evaluate the performance results, and compare the performance of the two models. Regarding the method used, the Random Forest Regression Method is a method that applies the Ensemble Learning Technique by combining several decision trees to produce predictions. Meanwhile, the Support Vector Regression Method is a method that works by building a hyperplane or collection of hy- perplane in high-dimensional space which can be used for linear or nonlinear regression. The dataset used is medical data originating from the Ministry of Health of the Republic of Indonesia. On the dataset, data preprocessing is carried out, namely the data is processed in the aspects of missing values handling, encoding, and outliers detection and outliers handling. Then, feature selection is carried out using Spearman’s Rank Correlation Co- efficient. After that, machine learning model using RF Method and machine learning model using SVR Method were created separately for each gender. Finally, the model performance is evaluated and its performance compared using evaluation metrics, namely Root Mean Square Error (RMSE), Coefficient of Determination (R2), and Adjusted R2, as well as running time. The RF Method used best hyperparameters {’max depth’: 15, ’n estimators’: 1150} for the male dataset, and {’max depth’: 15, ’n estimators’: 1250 } for the female dataset. Meanwhile, the SVR Method used best hyperparameters {’C’: 2, ’epsilon’: 0.2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’toll’: 0.005} for the male dataset, and {’C’: 3, ’epsilon’: 0, 2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’toll’: 0.005} for female dataset. The result is that the model built using the RF Method has quite good performance, with an RMSE value of = 7.532; R2 = 0.403; Adjusted R2 = 0.351; running time = 0.154 for men and RMSE = 6.889; R2 = 0.340; Adjusted R2 = 0.264; running time = 0.179 for women. Apart from that, SVR also has performance that tends to be the same but slightly worse, with an RMSE value of = 7,692; R2 = 0.376; Adjusted R2 = 0.321; running time = 0.035 for men and RMSE = 6.905; R2 = 0.337; Adjusted R2 = 0.306; running time = 0.080 for women. Based on the model performance analysis carried out in this research, the model built using the Random Forest Regression Method is superior in predicting biological age compared to the Support Vector Regression Method."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Puteri Kintandani

Aplikasi support vector regression dengan seleksi fitur menggunakan particle swarm optimization untuk prediksi harga saham di Indonesia = Application of support vector regression in Indonesian stock price prediction with feature selection using particle swarm optimization

"Investasi saham merupakan salah satu jenis investasi yang paling populer karena saham memberikan tingkat keuntungan yang tinggi dibandingkan dengan jenis investasi lainnya, tetapi saham juga memiliki tingkat risiko yang tinggi. Fluktuasi harga saham memberikan peluang bagi investor untuk mendapatkan keuntungan yang tinggi. Dibutuhkan sebuah model prediksi harga saham untuk melihat pergerakan harga saham di masa yang akan datang, sehingga investor dapat menentukan waktu yang tepat untuk membeli, menahan, dan menjual saham mereka. Dengan demikian, mereka terlepas dari risiko kerugian dan memperoleh keuntungan yang besar. Terdapat beberapa studi yang membahas tentang prediksi harga saham menggunakan machine learning. Salah satunya yaitu menggunakan Support Vector Regression (SVR). Oleh karena itu, pada skripsi ini akan diuji penerapan SVR menggunakan Particle Swarm Optimization (PSO) sebagai seleksi fitur dalam memprediksi harga saham di Indonesia. Pada skripsi ini digunakan data historis saham harian dari Jakarta Stock Index dan beberapa saham pada sektor real estate dan properti. Beberapa indikator teknikal digunakan sebagai fitur dalam memprediksi harga saham. Studi ini menunjukkan bahwa prediksi harga saham menggunakan SVR dengan PSO sebagai seleksi fitur memiliki kinerja yang baik untuk semua data, fitur, dan jumlah data training yang digunakan pada skripsi ini memiliki nilai error yang kecil. Oleh karena itu, diperoleh model yang akurat untuk memprediksi harga saham di Indonesia.

Stock investing is one of the most popular types of investments since it provides the highest return among all investment types, although it is associated with considerable risk. Fluctuating stock prices provide an opportunity for investors to make a high profit. A stock price prediction model is needed to see future stock price movements, so investors can decide the right time to buy, hold, and sell their stocks which regardless of the risk of loss and gain a big profit. Several studies have focused on the prediction of stock prices using machine learning. One of them is Support Vector Regression (SVR). Therefore, this study examines the application of SVR using Particle Swarm Optimization (PSO) as feature selection in predicting Indonesian stock price. This thesis used historical daily stock data from Jakarta Stock Index (JKSE) and several real estates and property stock sectors. Some technical indicators are used as a feature in predicting stock price. The study found that stock price prediction using SVR with PSO as feature selection showed good performances for all data, features and the amount of training data used by the study have relatively low error probabilities. Therefore, an accurate model is obtained to predict stock price in Indonesia."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Nurrimah

Aplikasi fuzzy support vector regression dengan pemilihan fitur fisher score dalam memprediksi harga saham = Application of fuzzy support vector regression with fisher score feature selection in predicting stock price

"Globalisasi membawa dampak besar bagi pertumbuhan ekonomi Indonesia. Sejak tahun 1961, secara umum pertumbuhan ekonomi Indonesia selalu mengalami kenaikan. Banyak faktor yang menyebabkan meningkatnya pertumbuhan ekonomi nasional. Salah satunya adalah investasi. Terdapat berbagai macam instrumen investasi. Sekarang ini yang paling banyak diminati oleh masyarakat umum adalah investasi saham. Bursa Efek Indonesia (BEI) mencatat bahwa per Juni 2018 banyaknya investor pasar modal mencapai 1,12 juta Single Investor Identification (SID) dengan 710.000 Single Investor Identification (SID) merupakan total investor saham ritel. Saham menjadi salah satu usaha dalam pemenuhan kebutuhan hidup di masa depan. Daya tarik utamanya adalah karena saham memberikan potensi keuntungan yang tinggi dalam jangka panjang. Namun, dengan potensi keuntungan yang tinggi tersebut, saham juga memiliki potensi kerugian yang tinggi. Salah satu usaha untuk meminimalkan potensi kerugian saham adalah dengan melakukan prediksi harga saham menggunakan machine learning. Harga saham akan diprediksi menggunakan metode penyelesaian masalah regresi, yaitu Fuzzy Support Vector Regression (FSVR). Fungsi pemetaan dalam fungsi keanggotaan fuzzy digunakan untuk menghasilkan fluktuasi harga saham yang tepat. Untuk memastikan keefektifan dan keefisienan penggunaan fitur, Fisher Score digunakan untuk memilih fitur yang paling berpengaruh dan informatif dalam model prediksi sehingga kesalahan hasil prediksi dapat diminimalkan. Fitur-fitur terpilih tersebut akan dijadikan sebagai variabel input dalam model prediksi. Evaluasi hasil prediksi dari data dengan dan tanpa dilakukan pemilihan fitur selanjutnya akan dianalisis menggunakan Normalized Mean Square Error (NMSE) dan dibandingkan sebagai bagian dari evaluasi performa model prediksi. Dari hasil prediksi pada salah satu data yang digunakan, tanpa pemilihan fitur, diperoleh model terbaik dengan nilai NMSE terendah sebesar 0,179 dan persentase data training 80%, sedangkan dengan pemilihan fitur Fisher Score, diperoleh model terbaik menggunakan sembilan fitur dengan nilai NMSE terendah sebesar 0,011 dan persentase data training 90%.

Globalization has a big impact on Indonesias economic growth. Since 1961, in general Indonesias economic growth has always increased. Many factors have led to an increase in national economic growth. One of which is investment. There are many investment instruments. The most popular among the public is stock investment. Indonesia Stock Exchange (IDX) recorded as of June 2018 total of capital market investors reached 1,12 million Single Investor Identification (SID) with 710,000 Single Investor Identification (SID) representing total retail stock investors. Stock has become one of the activities to fulfill the needs of life in the future. Its main attraction is that stock provides high potential return of profit in long run. However, as high return of profit, stock also has high potential return of risks. One of the ways to minimize the potential return of risks is by predicting stock prices using machine learning. The stock prices will be predicted using a regression problem solving method, namely Fuzzy Support Vector Regression (FSVR). The mapping function in fuzzy membership function is used to produce the right stock price fluctuations. To ensure the effectiveness and the efficiency of using features, Fisher Score is used to select the most influential and informative features in the prediction model so that the prediction errors can be minimized. These selected features will be used as input variables in the stock price prediction model. The evaluation of the prediction results from the data with and without feature selection will be analyzed using Normalized Mean Square Error (NMSE) and compared as part of the performance evaluation of the prediction model. From the prediction results on one of data used, without doing feature selection, the best model is obtained with the lowest error is 0.179 and 80% training data, while with doing Fisher Score feature selection, the best model is obtained by using nine features with the lowest error is 0.011 and 90% training data."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian