Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 203711 dokumen yang sesuai dengan query
cover
Salma Mazaya Fasya
"Penuaan merupakan kumpulan perubahan biologis pada tubuh manusia yang terjadi secara bertahap dan dapat meningkatkan risiko terjadinya penyakit bahkan kematian. Hingga saat ini, usia kronologis menjadi indikator penuaan yang paling umum digunakan dalam dunia kesehatan. Akan tetapi, munculnya konsep usia biologis diyakini mampu memberikan pengukuran yang lebih akurat terkait penuaan pada manusia dibandingkan dengan usia kronologis. Usia biologis dipengaruhi oleh berbagai faktor yang disebut biomarker. Penelitian ini berfokus pada prediksi usia biologis berdasarkan usia kronologis dan fitur (biomarker) lainnya dengan memanfaatkan metode machine learning Extreme Gradient Boosting (XGBoost) dan Support Vector Regression (SVR). Dataset yang digunakan berupa data pemeriksaan medis oleh Kementerian Kesehatan RI. Pada dataset tersebut dilakukan data preprocessing, seleksi fitur menggunakan Spearman’s Rank Correlation Coefficient, dan pembangunan model. Model dievaluasi menggunakan metrik evaluasi pada model regresi yaitu Root Mean Square Error (RMSE), Coefficient of Determination , dan Adjusted . Ketiga metrik ini masing-masing menghitung selisih nilai prediksi dengan nilai aktual dan menunjukkan seberapa baik variabel dependen dapat dijelaskan oleh variabel independen pada model. Dengan metode XGBoost diperoleh nilai RMSE 8,0560, 0,2894, dan Adjusted 0,2006 untuk data pria, serta RMSE 6,3851, 0,4252, dan Adjusted 0,3938 untuk data wanita. Dengan metode SVR, diperoleh RMSE 8,0697, 0,2870, dan Adjusted 0,1979 untuk data pria, serta RMSE 6,7147, 0,3643, dan Adjusted sebesar 0,3296. Metode XGBoost lebih unggul dalam memprediksi usia biologis baik pada model pria maupun wanita dibandingkan metode SVR. Usia kronologis dan biomarker (fitur) lainnya terkait kesehatan juga ditemukan berpengaruh positif terhadap usia biologis seorang individu.

Aging is a collection of biological changes in the human body that occur gradually and can increase the risk of disease and even death. Until now, chronological age is the most commonly used indicator of aging in the medical sector. However, the emergence of the concept of biological age is believed to be able to provide a more accurate measurement of aging in humans compared to chronological age. Biological age is influenced by various factors called biomarkers. This research focuses on predicting biological age based on chronological age and other features (biomarkers) by utilizing the Extreme Gradient Boosting (XGBoost) and Support Vector Regression (SVR) machine learning methods. The dataset used is medical examination data by the Indonesian Ministry of Health. Data preprocessing was performed on this dataset, followed by feature selection using the Spearman Rank Correlation Coefficient, and subsequent model development. The model is evaluated using evaluation metrics in the regression model, namely Root Mean Square Error (RMSE), Coefficient of Determination , and Adjusted . These three metrics each calculate the difference between the predicted and actual values and indicate how well the dependent variable can be explained by the independent variables in the model. Using the XGBoost method, RMSE values were obtained of 8,0560, 0,2894, and Adjusted 0,2006 for male data, as well as RMSE 6,3851, 0,4252, dan Adjusted 0,3938 for female's data. Using the SVR method, RMSE 8,0697, 0,2870, and Adjusted 0,1979 were obtained for male data, as well as RMSE 6.7147, 0.3643, and Adjusted of 0,3296 for female's data. The XGBoost method demonstrates better performance in predicting biological age for both male and female models compared to the SVR method. Chronological age and other health-related biomarkers (features) were also found to have a positive impact on an individual's biological age."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Kayla Calista Ayal
"Usia biologis mengukur penuaan individu berdasarkan kondisi fisik dan fungsi organ. Meskipun banyak penelitian telah dilakukan untuk memprediksi usia biologis dengan berbagai metode, penerapan metode machine learning masih memiliki ruang untuk penelitian lebih lanjut. Penelitian ini mengimplementasikan dua metode machine learning dengan pendekatan yang berbeda, yaitu metode Support Vector Regression (SVR) dan Light Gradient Boosting Machine (LGBM) dalam memprediksi usia biologis menggunakan data pemeriksaan medis Kementerian Kesehatan tahun 2011 yang mencakup 5960 subjek dan 41 fitur. Proses preprocessing meliputi penyaringan usia kronologis > 30 tahun, pemisahan data berdasarkan jenis kelamin, penanganan missing values dan outlier, serta data encoding. Feature selection menggunakan koefisien korelasi Spearman menghasilkan 8 fitur berbeda untuk setiap jenis kelamin. Data dibagi dengan 90% untuk pelatihan dan 10% untuk pengujian, serta dilakukan tuning hyperparameter menggunakan GridSearchCV. Penelitian ini menggunakan metrik RMSE dan adjusted R-squared, yang dipilih berdasarkan relevansinya dengan tujuan penelitian. Hasil menunjukkan LGBM lebih unggul dari SVR dengan RMSE 7,2064 tahun dan adjusted R-squared 33,36% pada pria, serta RMSE 7,1475 tahun dan adjusted R-squared 22,16% pada wanita. Analisis korelasi menunjukkan hubungan yang wajar antara usia biologis dan usia kronologis serta korelasi yang cukup antara usia biologis dengan biomarker tekanan sistolik dan status hipertensi pada pria, serta tekanan sistolik dan kolesterol pada wanita. Analisis korelasi menunjukkan hubungan signifikan antara usia biologis dengan usia kronologis dan beberapa biomarker. Secara keseluruhan, LGBM lebih efektif dalam memprediksi usia biologis dibandingkan SVR. Hasil dari penelitian diharapkan dapat diaplikasikan dalam kehidupan sehari-hari, seperti membantu perusahaan asuransi menilai kelayakan klaim berdasarkan prediksi usia biologis, serta mendukung keputusan di bidang kesehatan preventif.

Biological age measures an individual's aging based on physical condition and organ function. Although numerous studies have been conducted to predict biological age using various methods, there is still room for further research in the application of machine learning techniques. This study implements two machine learning methods with different approaches, namely Support Vector Regression (SVR) and Light Gradient Boosting Machine (LGBM), to predict biological age using medical examination data from the Ministry of Health in 2011, covering 5960 subjects and 41 features. The preprocessing steps include filtering chronological age > 30 years, segregating data by gender, handling missing values and outliers, and data encoding. Feature selection using Spearman correlation coefficients resulted in 8 different features for each gender. The data was split into 90% for training and 10% for testing, with hyperparameter tuning performed using GridSearchCV. This study used RMSE and adjusted R-squared metrics, selected based on their relevance to the research objectives. The results show that LGBM outperformed SVR with an RMSE of 7.2064 years and an adjusted R-squared of 33.36% for men, and an RMSE of 7.1475 years and an adjusted R-squared of 22.16% for women. Correlation analysis revealed a significant relationship between biological age and chronological age, as well as a reasonable correlation between biological age and biomarkers such as systolic blood pressure and hypertension status in men, and systolic blood pressure and cholesterol in women. Overall, LGBM proved to be more effective in predicting biological age compared to SVR. The results of this study are expected to be applicable in everyday life, such as assisting insurance companies in evaluating claim eligibility based on biological age predictions, as well as supporting decision-making in preventive healthcare."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Angelica Patricia Djaya Saputra
"Penuaan biologis mencerminkan kondisi kesehatan fisik yang sebenarnya karena menilai fungsi organ dan sistem tubuh yang sebenarnya pada setiap individu, berbeda dengan usia kronologis. Penelitian ini mengeksplorasi prediksi usia biologis menggunakan metode Support Vector Regression (SVR) dan Klemera-and-Doubal Method (KDM), yang berfokus pada pengaruh biomarker dan faktor eksternal pada proses penuaan. Pembangunan model memanfaatkan data pemeriksaan medis dari Kementerian Kesehatan Indonesia pada tahun 2011 dimana keterbaharuan dari penelitian ini adalah melibatkan semua fitur yang berperngaruh terhadap usia biologis, termasuk faktor eksternal, tidak hanya biomarker saja. Kemudian, dilakukan pemanfaatan seluruh dataset tanpa membedakan subjek sehat dan tidak sehat. Pada dataset dilakukan data preprocessing agar dataset siap digunakan dengan melakukan filtering usia di atas 30 tahun, pemisahan dataset pria dan wanita, menghapus fitur yang tidak relevan, mengubah tipe data yang tidak sesuai, mengidentifikasi dan melakukan penanganan missing value serta outliers, dan melakukan encoding untuk data beripe kategorikal. Kemudian, dilakukan feature selection dengan menggunakan Spearman’s rank Coefficient Corelation dan pembangunan model SVR dan KDM. Hasil penelitian menunjukkan bahwa terpilih 5 fitur untuk pria dan 6 fitur untuk wanita yang digunakan untuk membangun model SVR dan KDM. KDM menunjukkan performa evaluasi yang cukup baik dalam interpretasi variasi data dengan skor performa RMSE 1,39; R2 0,97; dan Adjusted R2 0,97 untuk pria dan RMSE 1,00; R2 0,99; dan Adjusted R2 0,99 untuk wanita. Metode ini lebih unggul daripada SVR yang cenderung menunjukkan performa yang kurang memuaskan dimana memiliki skor performa RMSE 6,36; R2 0,44; dan Adjusted R2 0,36 untuk pria dan RMSE 5,90; R2 0,57; dan Adjusted R2 0,53 untuk wanita. Berdasarkan hasil analisis dari berbagai teknik analisis yang dilakukan (analisis evaluasi performa, analisis hubungan usia kronologis dengan usia biologis, dan analisis evaluasi dengan melihat pola hasil estimasi) terlihat bahwa metode KDM lebih unggul dalam memprediksi usia biologis dibandingkan dengan SVR, terutama dalam hal konsistensi dan akurasi. Selain itu, analisis hubungan setiap fitur dengan usia biologis untuk tiap model menggambarkan pengaruh fitur-fitur tersebut terhadap fungsi organ tubuh seseorang.

The biological aging reflects the actual physical health condition as it assesses the real function of organs and body systems in each individual, different from chronological age. This research explores the prediction of biological age using the Support Vector Regression (SVR) method and the Klemera-and-Doubal Method (KDM), focusing on the influence of biomarkers and external factors on the aging process. The model development utilized medical examination data from the Indonesian Ministry of Health in 2011, where the novelty of this research is involving all features that affect biological age, including external factors, not just biomarkers. Then, the entire dataset was utilized without distinguishing between healthy and unhealthy subjects. In the dataset, data preprocessing was performed to make the dataset ready to use by filtering ages above 30 years, separating datasets for men and women, removing irrelevant features, changing inappropriate data types, identifying and handling missing values and outliers, and encoding for categorical data. Subsequently, feature selection was conducted using Spearman's Rank Coefficient Correlation, and then the SVR and KDM models were built. The research results showed that 5 features for men and 6 features for women were selected to build the SVR and KDM models. KDM showed fairly good evaluation performance in interpreting data variations with performance scores of RMSE 1.39, R^2 0.97, and Adjusted R^2 0.97 for men and RMSE 1.00, R^2 0.99, and Adjusted R^2 0.99 for women. This method outperformed SVR, which tended to show less satisfactory performance with performance scores of RMSE 6.36, R^2 0.44, and Adjusted R^2 0.36 for men and RMSE 5.90, R^2 0.57, and Adjusted R^2 0.53 for women. Based on the analysis results from various techniques performed (performance evaluation analysis, analysis of the relationship between chronological age and biological age, and evaluation analysis by looking at the pattern of estimation results), it appears that the KDM method is superior in predicting biological age compared to SVR, especially in terms of consistency and accuracy. In addition, the analysis of the relationship of each feature with biological age for each model illustrates the influence of these features on the organ function of an individual."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Adhitya Dwi Nugraha
"Ledakan batu merupakan kecelakaan destruktif yang cukup sering terjadi pada tambang bawah tanah. Seiring dengan berkembangnya teknologi, machine learning hadir sebagai alternatif solusi yang dapat dimanfaatkan dalam langkah preventif atas kasus ledakan batu. Penelitian ini menggunakan GWO-SVM dan XGBoost sebagai model machine learning dalam klasifikasi ledakan batu dan intensitasnya pada tambang bawah tanah. Grey Wolf Optimization (GWO) digunakan sebagai optimizer dari parameter SVM. Intensitas ledakan batu dibedakan atas tidak ada ledakan batu, lemah, sedang dan kuat. Dalam implementasi model, digunakan 467 kasus ledakan batu yang dikumpulkan dari berbagai sumber. Fitur yang digunakan pada penelitian ini meliputi tegangan maksimal tangensial, kekuatan tekan uniaksial, kekuatan tarik uniaksial, koefisien tegangan, koefisien kerapuhan batuan, dan indeks regangan elastis. Sebelum implementasi model dilakukan data preprocessing yang meliputi imputasi missing values, menghapus outlier, normalisasi fitur dan resampling data. Kinerja model dievaluasi berdasarkan nilai metrik accuracy, precision, recall, dan f1-score dengan memerhatikan running time dan proporsi data training berkisar dari 50% hingga 90%. Hasil penelitian menunjukkan bahwa GWO-SVM mengungguli XGBoost baik dalam klasifikasi ledakan batu dengan accuracy 98.0392%, precision 97.8495%, recall 98.2609%, dan f1-score 98.0161% serta klasifikasi intensitas ledakannya dengan accuracy 75.8242%, precision 75.1473%, recall 75.3115%, dan f1-score 75.2150%.

Rockburst is a destructive accident that frequently occurs in underground mines. With the advancement of technology, machine learning has emerged as an alternative solution that can be utilized to measures against rockbursts. This research employs GWO-SVM and XGBoost as machine learning models for the classification of rockburst and its intensity in underground mines. Grey Wolf Optimization (GWO) is used as an optimizer for SVM parameters. The intensity of a rockburst is classified into four categories: no rockburst, weak, moderate, and strong. The implementation of the model utilizes 476 cases of rockburst collected from various sources. The features used in this study include maximum tangential stress, uniaxial compressive strength, uniaxial tensile strength, stress coefficient, rock brittleness coefficient, and elastic strain index. Before implementing the model, data preprocessing is conducted, which includes imputing missing values, removing outliers, feature normalization, and data resampling. The performance of the model is evaluated based on metrics such as accuracy, precision, recall, and f1-score with various training data proportions ranging from 50% to 90%. The research results indicate that GWO-SVM outperforms XGBoost in both the classification of rockburst with 98.0392% accuracy, 97.8495% precision, 98.2609% recall, and 98.0161% f1-score as well as intensity with 75.8242% accuracy, 75.1473% precision, 75.3115% recall, and 75.2150% f1-score.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Naufal Alfarisi
"Demam Berdarah Dengue (DBD) masih menjadi masalah kesehatan yang utama di Indonesia.  Berdasarkan data dari Kemenkes RI, pada tahun 2022 jumlah insiden DBD dicatat sebanyak 131.265 yang mana sekitar 40% adalah anak-anak usia 0 sampai 14 tahun dengan jumlah kasus kematian mencapai 1.135 jiwa dengan 73% terjadi pada anak-anak usia 0 sampai 14 tahun. DBD disebabkan oleh virus dengue yang disebarkan melalui gigitan nyamuk Aedes aegypti  dan Aedes albopictus.. Selain faktor kebersihan lingkungan dan kebiasaan masyarakat, tingginya insiden DBD di Indonesia juga dipengaruhi oleh beberapa faktor iklim seperti curah hujan, temperatur, dan kelembapan. Memaksimalkan proses pencegahan DBD oleh pemerintah dan masyarakat dapat menekan tingginya kasus DBD di Indonesia. Salah satu cara untuk memaksimalkan proses pencegahan DBD adalah dengan melakukan prediksi jumlah insiden DBD yang akan terjadi kedepannya. Dengan mengetahui hasil prediksi jumlah insiden DBD, diharapkan masyarakat dan pemerintah dapat memaksimalkan proses pencegahan DBD. Pada tugas akhir ini, dilakukan prediksi jumlah insiden DBD menggunakan convolutional neural network dan extreme gradient boosting, dengan jumlah insiden sebelumnya dan faktor cuaca sebelumnya yang terdiri dari temperatur, curah hujan, dan kelembapan relatif sebagai variabel prediktor. Variabel prediktor yang digunakan ditentukan berdasarkan time lag dari masing-masing variabel prediktor terhadap jumlah insiden DBD menggunakan korelasi silang. Model convolutinal neural network dan extreme gradient boosting yang dibentuk dievaluasi dan dibandingkan berdasarkan nilai Root Mean Square Error (RMSE), Mean Absolute Error (MAE), dan waktu simulasi. Pada tugas akhir ini, convolutional neural network memberikan performa yang lebih baik dibandingkan dengan extreme gradient boosting berdasarkan nilai RMSE dan MAE dengan rata-rata 13,3586 untuk RMSE dan 9,2249 untuk MAE. Berdasarkan waktu simulasi, extreme gradient boosting memberikan performa yang lebih cepat dibandingkan convolutional neural network.

Dengue Hemorrhagic Fever (DHF) remains a major health problem in Indonesia. Based on data from the Ministry of Health of Indonesia, in 2022, the number of DHF incidents recorded was 131,265, of which approximately 40% were children aged 0 to 14 years, with a total of 1,135 deaths, 73% of which occurred in children aged 0 to 14 years. DHF is caused by the dengue virus, which is transmitted through the bites of Aedes aegypti and Aedes albopictus mosquitoes. In addition to environmental cleanliness and societal habits, the high incidence of DHF in Indonesia is also influenced by several climate factors such as rainfall, temperature, and humidity. Maximizing the DHF prevention process by the government and the community can help reduce the number of DHF cases in Indonesia. One way to maximize the DHF prevention process is by predicting the future number of DHF incidents. By knowing the predicted number of DHF incidents, it is hoped that the community and the government can maximize the DHF prevention process. In this final project, the prediction of the number of DHF incidents is carried out using convolutional neural network and extreme gradient boosting, with the previous incident counts and previous weather factors consisting of temperature, rainfall, and relative humidity as predictor variables. The predictor variables used are determined based on the time lag of each predictor variable on the number of DHF incidents using cross-correlation. In this final project, the convolutional neural network outperforms extreme gradient boosting based on the RMSE and MAE values, with an average of 13.3586 for RMSE and 9.2249 for MAE. However, in terms of simulation time, extreme gradient boosting demonstrates faster performance compared to the convolutional neural network."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nadia Hartini Kusumawijaya
"Penuaan adalah salah satu faktor utama resiko terjadinya penyakit dan kematian. Laju
penuaan individu dengan usia kronologis yang sama terbukti bervariasi. Maka dari
itu, muncul kebutuhan untuk alat pengukuran penuaan yang lebih akurat, robust, dan
dapat diandalkan dibandingkan usia kronologis, yakni usia biologis. Pada penelitian
ini, penulis membangun model menggunakan Metode Random Forest Regression (RF)
dan Metode Support Vector Regression (SVR) untuk memprediksi umur biologis pada
data pemeriksaan medis, menilai dan mengevaluasi hasil kinerjanya, serta melakukan
komparasi kinerja kedua metode. Terkait metode yang digunakan, Metode RF adalah
metode yang mengaplikasikan Teknik Ensemble Learning dengan cara menggabungkan
beberapa decision tree untuk menghasilkan prediksi. Sedangkan, Metode SVR adalah
metode yang berkerja dengan cara membangun hyperplane atau kumpulan hyperplane
dalam ruang berdimensi tinggi yang dapat digunakan untuk regresi linier atau nonlinier.
Dataset yang digunakan adalah data medis yang berasal dari Kementrian Kesehatan
Republik Indonesia. Pada dataset dilakukan data preprocessing, yakni data diproses pada
aspek missing values handling, encoding, dan outliers detection and outliers handling.
Kemudian, dilakukan feature selection menggunakan Spearman’s Rank Correlation
Coefficient. Setelah itu, dilakukan pembangunan model dengan Metode RF dan model
dengan Metode SVR secara terpisah untuk masing - masing jenis kelamin. Terakhir,
performa model dievaluasi dan dibandingkan kinerjanya menggunakan metrik evaluasi
Root Mean Square Error (RMSE), Coefficient of Determination (R2), Adjusted R2, dan
running time. Metode RF menggunakan hyperparameter terbaik {’max depth’: 15,
’n estimators’: 1150} untuk dataset pria, dan {’max depth’: 15, ’n estimators’: 1250}
untuk dataset wanita. Sedangkan, Metode SVR menggunakan hyperparameter terbaik
{’C’: 2,’epsilon’: 0,2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’tol’: 0,005} untuk dataset pria,
dan {’C’: 3, ’epsilon’: 0,2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’tol’: 0,005} untuk dataset
wanita. Metode RF memiliki kinerja yang cukup baik, dengan nilai RMSE = 7,532; R2
= 0,403; Adjusted R2 = 0,351; running time = 0,154 untuk pria dan RMSE = 6,889;
R2 = 0,340; Adjusted R2 = 0,264; running time = 0,179 untuk wanita. Selain itu, SVR
juga memiliki performa yang cenderung sama namun sedikit lebih buruk, dengan nilai
RMSE = 7,692; R2 = 0,376; Adjusted R2 = 0,321; running time = 0,035 untuk pria dan
RMSE = 6,905; R2 = 0,337; Adjusted R2 = 0,306; running time = 0,080 untuk wanita.
Berdasarkan analisis kinerja model yang dilakukan pada penelitian ini model yang
dibangun dengan Metode Random Forest Regression lebih unggul dalam memprediksi
usia biologis dibandingkan dengan Metode Support Vector Regression.

Aging is one of the main risk factors for disease and death. The aging rate of individ- uals of the same chronological age has been shown to vary. So therefore, a need arises for a more accurate, robust, and reliable aging measurement tool than chronological age, namely biological age. In this research, the author build a model using the Random For- est Regression (RF) Method and the Support Vector Regression (SVR) Method to predict biological age from patient clinical data, assess and evaluate the performance results, and compare the performance of the two models. Regarding the method used, the Random Forest Regression Method is a method that applies the Ensemble Learning Technique by combining several decision trees to produce predictions. Meanwhile, the Support Vector Regression Method is a method that works by building a hyperplane or collection of hy- perplane in high-dimensional space which can be used for linear or nonlinear regression. The dataset used is medical data originating from the Ministry of Health of the Republic of Indonesia. On the dataset, data preprocessing is carried out, namely the data is processed in the aspects of missing values handling, encoding, and outliers detection and outliers handling. Then, feature selection is carried out using Spearman’s Rank Correlation Co- efficient. After that, machine learning model using RF Method and machine learning model using SVR Method were created separately for each gender. Finally, the model performance is evaluated and its performance compared using evaluation metrics, namely Root Mean Square Error (RMSE), Coefficient of Determination (R2), and Adjusted R2, as well as running time. The RF Method used best hyperparameters {’max depth’: 15, ’n estimators’: 1150} for the male dataset, and {’max depth’: 15, ’n estimators’: 1250 } for the female dataset. Meanwhile, the SVR Method used best hyperparameters {’C’: 2, ’epsilon’: 0.2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’toll’: 0.005} for the male dataset, and {’C’: 3, ’epsilon’: 0, 2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’toll’: 0.005} for female dataset. The result is that the model built using the RF Method has quite good performance, with an RMSE value of = 7.532; R2 = 0.403; Adjusted R2 = 0.351; running time = 0.154 for men and RMSE = 6.889; R2 = 0.340; Adjusted R2 = 0.264; running time = 0.179 for women. Apart from that, SVR also has performance that tends to be the same but slightly worse, with an RMSE value of = 7,692; R2 = 0.376; Adjusted R2 = 0.321; running time = 0.035 for men and RMSE = 6.905; R2 = 0.337; Adjusted R2 = 0.306; running time = 0.080 for women. Based on the model performance analysis carried out in this research, the model built using the Random Forest Regression Method is superior in predicting biological age compared to the Support Vector Regression Method."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Viane Angelia De Deeva
"Utang luar negeri Indonesia selama periode tahun 2011 sampai dengan 2022 cenderung terus meningkat. Pada tahun 2022, utang luar negeri Indonesia mengalami kenaikan pertumbuhan sebesar 4,1% YoY (Year on Year) dari tahun 2021. Selain disebabkan oleh pemerintah dan sektor swasta, masalah ini juga dipengaruhi oleh pelemahan mata uang dolar Amerika Serikat terhadap mayoritas mata uang global. Skripsi ini menganalisis ketahanan perusahaan di Indonesia yang memiliki utang luar negeri terhadap kebangkrutan saat terjadi depresiasi nilai tukar mata uang menggunakan metode machine learning yaitu Ridge Regression dan Support Vector Regression. Skripsi ini mengamati neraca perusahaan dari 50 perusahaan sektor non-keuangan yang menjadi emiten di Bursa Efek Indonesia dari tahun 2011 sampai dengan 2022. Hasil penelitian ini menunjukkan bahwa metode Ridge Regression dan Support Vector Regression memiliki kinerja yang setara dalam menghasilkan akurasi prediksi. Hasil analisis untuk keseluruhan sampel dan kelompok importir (baik eksportir maupun non-eksportir) menunjukkan competitiveness effect lebih dominan dari balance-sheet effect. Namun, untuk kelompok non-importir (baik eksportir maupun non-eksportir) menunjukkan balance-sheet effect lebih dominan dari competitiveness effect. Sehingga, kelompok perusahaan tersebut disarankan untuk meminimalisasikan transaksi utang luar negeri agar perusahaan dapat tetap bertahan.

Indonesia's foreign debt has exhibited a continuous upward trajectory during the period 2011 to 2022. In 2022, the country's foreign debt experienced a year-on-year growth of 4.1% compared to 2021. In addition to being caused by government and private sector activities, this issue was also influenced by the depreciation of the United States dollar against the majority of global currencies. This thesis analyzes the resilience of Indonesian companies with foreign debt against bankruptcy during exchange rate depreciation using machine learning methods, specifically Ridge Regression and Support Vector Regression. This study examines the balance sheets of 50 non-financial sector companies listed on the Indonesia Stock Exchange from 2011 to 2022. The results of this research indicate that the Ridge Regression and Support Vector Regression methods have comparable performance in producing prediction accuracy. The results of the analysis for all samples and and the importer groups (both exporters and non-exporters) show that the competitiveness effect is more dominant than the balance-sheet effect. However, for the non-importer group (both exporters and non-exporters) it shows that the balance-sheet effect is more dominant than the competitiveness effect. Thus, it is recommended for companies within this group to minimize foreign debt transactions so that these companies can enhance their resilience."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Bagus Nurhuda
"Seiring bertambahnya jumlah pelanggan listrik di Indonesia menjadikan persentase kerugian dari susut non-teknis pada Perusahaan Listrik Negara (PLN) semakin besar tiap tahunnya yang menyebabkan berkurangnya keuntungan. Berbagai upaya telah dilakukan oleh PLN dengan membentuk tim Penertiban Pemakaian Tenaga Listrik (P2TL) berdasarkan informasi indikasi pencurian dan kelainan maupun pemilihan manual pada pelanggan pascabayar. Namun upaya yang dilakukan PLN sejauh ini masih belum efektif dalam penentuan Target Operasi (TO) karena membutuhkan waktu yang lama dengan hasil akurasi yang kecil. Tujuan dari penelitian ini adalah untuk menganalisis efektivitas dari data pemakaian listrik (kWh) pelanggan dalam pemodelan machine learning menggunakan algoritma Extreme Gradient Boosting (XGBoost) menggunakan metode feature engineering dan hyperparameter tuning. Hasil dari penelitian ini membuktikan bahwa penggunaan riwayat pemakaian listrik efektif dalam pemodelan hingga tingkat akurasi mencapai 80% pada penggunaan data jam nyala dan 82% pada penggunaan data gabungan jam nyala dengan metode statistik dan bantuan hyperparameter tuning. Dengan hasil ini dapat membantu PLN untuk menentukan TO pada pelanggan pascabayar dengan lebih mudah dan efisien menggunakan teknologi machine learning.

As the number of electricity customers in Indonesia increases, the percentage of non-technical losses in PLN (Perusahaan Listrik Negara) has been growing every year, leading to a decrease in profits. Various efforts have been made by PLN through the establishment of the Penertiban Pemakaian Tenaga Listrik (P2TL) team based on indications of theft or abnormalities and manual selection of postpaid customers. However, PLN's efforts so far have been ineffective in determining the Operational Target (TO) due to the long time required and low accuracy. The aim of this research is to analyze the effectiveness of customer electricity usage data (kWh) in machine learning modeling using the Extreme Gradient Boosting (XGBoost) algorithm with feature engineering and hyperparameter tuning methods. The results of this study demonstrate that the use of electricity usage history is effective in modeling, achieving an accuracy rate of 80% when using on/off hours data and 82% when using a combination of on/off hours data with statistical methods and the assistance of hyperparameter tuning. These findings can assist PLN in determining the TO for postpaid customers more easily and efficiently using machine learning technology."
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Mayang Nurul Aulia
"Performa akademik adalah bagian penting dari suatu sekolah. Saat ini, sebagian besar sekolah di Indonesia masih jarang melakukan klasifikasi performa akademik siswa, sehingga diperlukan metode yang tepat untuk mengklasifikasikan siswa berdasarkan perfroma akademiknya.  Pada peneltian ini digunakan metode Nave Bayes Classifier (NBC) dan metode Support Vector Machine (SVM) untuk mengklasifikasikan performa akademik siswa SMAN 38 Jakarta. Metode NBC menghasilkan tingkat akurasi tertinggi sebesar 96%, recall 100%, precision 92.68% dan %. Sedangkan metode SVM dengan kernel linier menghasilkan tingkat akurasi tertinggi sebesar 98%, recall 100%, precision 96.42% dan f1-score.

Academic performance is an important part of a school. At present, most schools in Indonesia rarely classify students’ academic performance, so we need the right method to classify students based on their academic performance. In this research, the Nave Bayes Classifier (NBC) and Support Vector Machine (SVM) methods are used to classify academic performance of SMAN 38 Jakarta students’. The NBC method produces the highest accuracy 96%, recall 100%, precision 92.68% and f1-score  While the SVM method produces the highest accuracy 98%, recall 100%, precision 96.42% and f1-score  on linear kernels."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Adhimas Yudha Prawira
"Twitter merupakan salah satu media sosial yang digunakan secara massive di Indonesia. Para pengguna Twitter ini membicarakan berbagai macam hal, salah satunya terkait pencalonan presiden. Perbincangan para pengguna Twitter ini memiliki nilai sentimen baik positif maupun negatif. Dukungan masyarakat terhadap masing-masing kandidat calon presiden dapat diketahui dengan melihat sentimen masyarakat melalui perbincangan mereka di Twitter, hal ini sering disebut juga sebagai analisis sentimen. Namun, jumlah pengguna dan obrolan para pengguna Twitter yang sangat banyak mengakibatkan data yang akan diproses membutuhkan waktu yang cukup lama. Untuk melakukan proses analisis sentimen para pengguna Twitter secara cepat dan otomatis dapat digunakan bantuan mesin. Salah satu metode yang digunakan untuk melakukan proses analisis sentimen adalah Support Vector Machine (SVM). Pada dasarnya, semakin banyak data yang digunakan sebagai data training dalam pemilihan model fungsi klasifikator maka akan memberikan generalisasi akurasi analisis sentimen untuk data testing yang tinggi pula. Namun di sisi lain, semakin banyaknya data training juga akan menyebabkan besarnya dimensi ruang fitur. Hal ini membuat mesin membutuhkan waktu yang cukup lama dalam melakukan pembentukan fungsi klasifikator. Untuk menanggulangi hal ini, akan dilakukan metode optimasi fitur sehingga mesin dapat tetap membentuk fungsi klasifikator dengan akurasi yang tinggi namun dengan dimensi ruang fitur yang rendah.

Twitter is a social media that used in Indonesia massively. Twitter users talk (tweet) about various things, one of them is about presidential nomination. Twitter user conversations have a positive or negative sentiment. Community support for each presidential candidate can be determined by looking at the public sentiment through their conversations on Twitter, this is often referred to sentiment analysis. However, the number of users and tweets cause the data to be processed requires quite a long time. Machine can be used to make the process of Twitter sentiment analysis quickly and automatically. One method that used to perform the sentiment analysis process is a Support Vector Machine (SVM). Basically, the more data that used as data training in the model selection function will give a high accuracy generalization sentiment analysis on data testing. On the other hand, the increasing number of training data will also cause large dimensional feature space. This makes the machine takes a long time to perform model selection. To overcome this problem, feature optimization will be performed. Feature optimization will preserve the high accuracy of the model, but with a low dimensional feature space."
Universitas Indonesia, 2014
S57179
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>