Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 22 dokumen yang sesuai dengan query
cover
Ferdi Ferandi
Abstrak :
Tesis ini mengusulkan metode Boosting yang termodifikasi berbasiskan AdaBoost M2 untuk melakukan klasifikasi obyek multikelas dengan menambahkan fungsi indikator pada faktor pengubah bobot. Metode ini diimplementasikan dalam sistem penghitung pengunjung untuk dapat mendeteksi dan membedakan pengunjung berdasarkan kendaraannya, menjejakinya, dan kemudian menghitung jumlahnya. Hasil ujicoba menunjukkan bahwa rata-rata akurasi AdaBoost M2 lebih tinggi 1.6% dibandingkan metode yang diusulkan dan tingkat false detection metode yang diajukan rata-rata dua kali lipat dari metode AdaBoost M2. Meskipun demikian, sistem penghitung pengunjung yang mengimplementasikan kedua metode tersebut memiliki akurasi penghitungan dan kecepatan deteksi yang hampir sama. Dari hasil ujicoba, terlihat bahwa penambahan fungsi indikator tidak memiliki pengaruh signifikan terhadap hasil klasifikasi, melainkan menjadi penyebab tingginya tingkat false detection pada metode yang diajukan.
This thesis proposes a modified Boosting method based on AdaBoost M2 byadding indicator function to the weight update factor for classifying multiclass objects. The proposed method is implemented on a visitor counter system to make it capable for detecting incoming objects (i.e., walking person, motorcycle, or car), track them, and count their number. Experimental result shows that AdaBoost M2 is 1.6% more accurate compared to the proposed method on average, and the proposed method has twice false detection rate compared to AdaBoost M2. Nevertheless, the visitor counter systems which implemented these two methods have same accuracy and detection speed. From the experimental result, it can be seen that adding indicator function doesn?t affect the classification result. Instead, the high false detection rate is the result of the indicator function.
Depok: Universitas Indonesia, 2008
T-Pdf
UI - Tesis Open  Universitas Indonesia Library
cover
M. Rasyid Rabbani
Abstrak :
Fraud atau kecurangan merupakan salah satu permasalahan yang masih dihadapi oleh industri asuransi dan masih memberikan kerugian yang sangat besar bagi industri ini. Biaya yang dikeluarkan pun untuk mengatasi permasalahan ini masih cukup besar, untuk itu dikembangkanlah sebuah model machine learning untuk membantu pencegahan terjadinya fraud pada asuransi. Salah satu model yang sedang sangat berkembang adalah model Imbalance-XGBoost, penelitian ini dilakukan untuk meninjau kemampuan model Imbalance-XGBoost dalam mendeteksi fraud sebagai langkah pencegahan fraud pada asuransi. Penelitian ini berhasil mendapati bahwa Imbalance-XGBoost memiliki performa yang lebih baik jika dibandingkan dengan model dasarnya yaitu XGBoost tanpa penanganan kelas tidak seimbang. ...... Fraud or dishonesty is one of the persistent challenges faced by the insurance industry and continues to result in significant losses for the industry. The costs incurred to address this issue are also quite substantial. Therefore, a machine learning model has been developed to assist in preventing insurance fraud. One of the models that is currently gaining traction is the Imbalance-XGBoost model. This research was conducted to assess the ability of the Imbalance-XGBoost model in detecting fraud as a preventive measure in insurance. The study found that Imbalance-XGBoost performs better compared to its base model, XGBoost, which does not handle imbalanced classes.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Bernadeta Nafirsta Ayu Nareswari
Abstrak :
Curah hujan merupakan unsur iklim yang memiliki keragaman dan fluktuasi yang tinggi di Indonesia. Hal ini membuat curah hujan merupakan unsur iklim yang paling dominan untuk mencirikan iklim di Indonesia. Berdasarkan gerakan udara naik untuk membentuk awan, terdapat tiga tipe hujan yaitu konvektif, orografik, dan gangguan. Pengukuran terhadap curah hujan dapat dilakukan dalam berbagai metode, salah satunya dengan menggunakan pengukuran jarak jauh yaitu radar (Radio Detecting and Ranging). Pada studi ini dilakukan perhitungan radar cuaca dengan menggunakan machine learninguntuk mengkaji keakuratan perhitungan data radar cuaca terhadap estimasi curah hujan di Pulau Biak, Indonesia. Produk dari radar cuaca merupakan data reflektifitas (Z). Penggunaan machine learning ini diterapkan pada data reflektifitas radar cuaca dimana data yang digunakan adalah C-MAX atau Column Maximum. Data curah hujan pada periode Desember 2021 sampai Februari 2022 di Kabupaten Biak diolah menggunakan algoritma yang berbeda, yaitu Decision Tree, Random Forest, Adaptive Boosting, Gradient Boosting Extreme Gradient Boosting. Hasil dari studi ini akan menunjukkan algoritma terbaik yang dapat digunakan untuk memprediksi estimasi curah hujan konvektif di Pulau Biak, Indonesia. Berdasarkan penelitian yang sudah dilakukan, didapatkan hasil R2 pada algoritma Decision Tree sebesar 0,70; Random Forest 0,60; Adaptive Boosting sebesar 0,42; Gradient Boosting sebesar 0,71 dan Extreme Gradient Boosting sebesar 0,73. Hasil analisis menunjukkan bahwa algoritma Extreme Gradient Boosting dapat memberikan estimasi curah hujan paling baik di Pulau Biak, Indonesia. ......Rainfall is an element of climate with high diversity and fluctuation in Indonesia. This makes rainfall the most dominant climate element to characterize the climate in Indonesia. Based on the movement of rising air to form clouds, there are three types of rain: convective, orographic, and disturbance. Rainfall can be measured in various methods, one of which is by using remote measurement, namely radar (Radio Detecting and Ranging). In this study, weather radar calculations were carried out using machine learning to assess the accuracy of weather radar data calculations on the estimated rainfall value on Biak Island, Indonesia. The product of weather radar is reflectivity (Z) data. The use of machine learning is applied to weather radar reflectivity data where the data used is C-MAX or Column Maximum. Rainfall data from December 2021 to February 2022 in Biak Regency is processed using five different algorithms: Decision Tree, Random Forest, Adaptive Boosting, Gradient Boosting, and Extreme Gradient Boosting. The result of this study will show the best algorithm that can be used to predict convective rainfall estimation in Biak Island, Indonesia. Based on the research that has been done, the R2 results obtained on the Decision Tree algorithm of 0.70; Random Forest 0.60; Adaptive Boosting of 0.42; Gradient Boosting of 0.71 and Extreme Gradient Boosting of 0.73. The analysis shows that the Extreme Gradient Boosting algorithm can estimate the best rainfall in Biak Island, Indonesia.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Made Wira Dhanar Santika
Abstrak :
Lingkar kepala janin merupakan salah satu biometrik paling penting dalam pemeriksaan perkembangan janin dengan menggunakan alat USG. Akan tetapi, pengukuran terhadap kepala janin bukanlah pekerjaan yang mudah. Penelitian ini bertujuan untuk membuat sistem pengukuran kepala janin otomatis. Sistem ini diharapkan dapat berjalan pada perangkat mobile sebagai bagian dari sistem telehealth. Pengukuran kepala janin pada penelitian ini dilakukan dengan metode object detection, dilanjutkan dengan Canny edge detection, lalu untuk piksel pada citra edge kemudian diproses pada tahap ellipse fitting. Evaluasi dilakukan dengan menggunakan metrik akurasi, presisi, recall, dan f1-score untuk metode object detection, dan error rate untuk ellipse fitting. Dari setiap metode yang dilakukan uji coba, hasil evaluasi menunjukan bahwa metode Adaptive Boosting dan ElliFit memiliki performa yang paling baik. Metode ini juga memiliki waktu eksekusi yang relatif cepat untuk sebuah perangkat mobile, yaitu 3-5 detik. ......Fetal head circumference (HC) is one of the most important biometrics in assessing fetal growth during prenatal ultrasound examinations. However, measuring the fetal head is not an easy task. This study aims to create an automatic fetal head measurement system. This system is expected to run on mobile devices as part of telehealth system. HC measurement can be done with object detection method, followed by Canny edge detection, then for every edge pixels, fetal head can be approximated using ellipse fitting. Evaluations are carried out using accuracy, precision, recall, and f1-score metrics for object detection methods, and error rates for ellipse fitting. From each method that was tested, the evaluation result showed that the Adaptive Boosting and ElliFit method had the best performance. This method also had a relatively fast execution time for a mobile device, which is 3-5 seconds.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Assyifa Ulhusna
Abstrak :
Credit scoring adalah sebuah sistem yang digunakan kreditor seperti bank dan perusahaan asuransi untuk menentukan apakah pemohon kredit termasuk dalam grup good credit yakni grup yang kemungkinan besar akan membayar utangnya tepat waktu atau bad credit yang merupakan grup dengan kemungkinan besar tidak membayar utangnya tepat waktu. Salah satu metode yang paling sering digunakan dalam pembuatan model credit scoring adalah binary logistic regression.  Namun, seiring dengan kemajuan komputasi, banyak metode lain yang berkembang saat ini untuk dipakai dalam pembuatan model credit scoring yakni, metode gradient boosting. Pada skripsi ini dilakukan implementasi metode binary logistic regression dan gradient boosting dalam pemodelan credit scoring. Hasil yang didapatkan dengan menggunakan data 537.667 debitur dengan rincian 535.705 good credits dan 1.962 bad credits adalah pada data train penggunaan gradient boosting memberikan nilai tingkat akurasi 79,65%, uji KS 0,5389 dan AUROC/AUC 0,8393. Sementara pada data test penggunaan gradient boosting memberikan nilai tingkat akurasi 79,92%, uji KS 0,5345 dan AUROC/AUC 0,8313.  Nilai-nilai tersebut lebih tinggi dibandingkan dengan penggunaan binary logistic regression baik pada data train maupun data test. Berdasarkan nilai uji AUC, metode gradient boosting tergolong klasifikasi yang baik, sedangkan metode binary logistic regression> tergolong klasifikasi yang cukup. Hasil simulasi ini menunjukkan untuk data yang digunakan, metode gradient boosting memberikan hasil yang lebih baik dari sisi akurasi, uji KS, dan AUROC/AUC daripada binary logistic regression. Dengan kata lain, metode gradient boosting dapat meningkatkan discriminant power, yakni kemampuan untuk membandingkan target yang lebih baik dibandingkan dengan metode binary logistic regression. ......Credit scoring is a system used by creditors such as banks and insurance companies to determine whether credit applicants are included in the good credit group, namely the group that is most likely to pay its debts on time or the bad credit group which is the group that is most likely to not pay its debts on time. One of the most frequently used methods in making credit scoring models is binary logistic regression. However, along with the progress of computation, many other methods are currently being developed to be used in making credit scoring models, namely, the gradient boosting method. In this thesis, we will compare the binary logistic regression and gradient boosting methods in credit scoring model. The results obtained using data from 537,667 debtors with details of 535,705 good credits and 1,962 bad credits are the train data using gradient boosting gives an accuracy rate of 79.65%, KS test 0.5389 and AUROC/AUC 0.8393. Meanwhile, the test data using gradient boosting gives an accuracy rate of 79.92%, KS test 0.5345, and AUROC/AUC 0.8313. These values ​​are higher than the use of binary logistic regression in both the train and test data. Based on the AUC test value, the gradient boosting method is a good classifier, while the binary logistic regression method is an acceptable classifier. The results of this simulation show that for the data used, the gradient boosting method gives better results in terms of accuracy, KS test, and AUROC/AUC than binary logistic regression. In other words, the gradient boosting method can increase discriminant power or the ability to compare targets better than the binary logistic regression method.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Naufal Alfarisi
Abstrak :
Demam Berdarah Dengue (DBD) masih menjadi masalah kesehatan yang utama di Indonesia.  Berdasarkan data dari Kemenkes RI, pada tahun 2022 jumlah insiden DBD dicatat sebanyak 131.265 yang mana sekitar 40% adalah anak-anak usia 0 sampai 14 tahun dengan jumlah kasus kematian mencapai 1.135 jiwa dengan 73% terjadi pada anak-anak usia 0 sampai 14 tahun. DBD disebabkan oleh virus dengue yang disebarkan melalui gigitan nyamuk Aedes aegypti  dan Aedes albopictus.. Selain faktor kebersihan lingkungan dan kebiasaan masyarakat, tingginya insiden DBD di Indonesia juga dipengaruhi oleh beberapa faktor iklim seperti curah hujan, temperatur, dan kelembapan. Memaksimalkan proses pencegahan DBD oleh pemerintah dan masyarakat dapat menekan tingginya kasus DBD di Indonesia. Salah satu cara untuk memaksimalkan proses pencegahan DBD adalah dengan melakukan prediksi jumlah insiden DBD yang akan terjadi kedepannya. Dengan mengetahui hasil prediksi jumlah insiden DBD, diharapkan masyarakat dan pemerintah dapat memaksimalkan proses pencegahan DBD. Pada tugas akhir ini, dilakukan prediksi jumlah insiden DBD menggunakan convolutional neural network dan extreme gradient boosting, dengan jumlah insiden sebelumnya dan faktor cuaca sebelumnya yang terdiri dari temperatur, curah hujan, dan kelembapan relatif sebagai variabel prediktor. Variabel prediktor yang digunakan ditentukan berdasarkan time lag dari masing-masing variabel prediktor terhadap jumlah insiden DBD menggunakan korelasi silang. Model convolutinal neural network dan extreme gradient boosting yang dibentuk dievaluasi dan dibandingkan berdasarkan nilai Root Mean Square Error (RMSE), Mean Absolute Error (MAE), dan waktu simulasi. Pada tugas akhir ini, convolutional neural network memberikan performa yang lebih baik dibandingkan dengan extreme gradient boosting berdasarkan nilai RMSE dan MAE dengan rata-rata 13,3586 untuk RMSE dan 9,2249 untuk MAE. Berdasarkan waktu simulasi, extreme gradient boosting memberikan performa yang lebih cepat dibandingkan convolutional neural network. ......Dengue Hemorrhagic Fever (DHF) remains a major health problem in Indonesia. Based on data from the Ministry of Health of Indonesia, in 2022, the number of DHF incidents recorded was 131,265, of which approximately 40% were children aged 0 to 14 years, with a total of 1,135 deaths, 73% of which occurred in children aged 0 to 14 years. DHF is caused by the dengue virus, which is transmitted through the bites of Aedes aegypti and Aedes albopictus mosquitoes. In addition to environmental cleanliness and societal habits, the high incidence of DHF in Indonesia is also influenced by several climate factors such as rainfall, temperature, and humidity. Maximizing the DHF prevention process by the government and the community can help reduce the number of DHF cases in Indonesia. One way to maximize the DHF prevention process is by predicting the future number of DHF incidents. By knowing the predicted number of DHF incidents, it is hoped that the community and the government can maximize the DHF prevention process. In this final project, the prediction of the number of DHF incidents is carried out using convolutional neural network and extreme gradient boosting, with the previous incident counts and previous weather factors consisting of temperature, rainfall, and relative humidity as predictor variables. The predictor variables used are determined based on the time lag of each predictor variable on the number of DHF incidents using cross-correlation. In this final project, the convolutional neural network outperforms extreme gradient boosting based on the RMSE and MAE values, with an average of 13.3586 for RMSE and 9.2249 for MAE. However, in terms of simulation time, extreme gradient boosting demonstrates faster performance compared to the convolutional neural network.
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fadil Ramadhani Darmastowo
Abstrak :
Daerah ekuator memiliki curah hujan yang tinggi karena terletak di dekat garis khatulistiwa, dimana matahari menghasilkan energi yang sangat tinggi sepanjang tahun. Ini berdampak pada habitat biologis, siklus air global, dan kehidupan sehari- hari manusia. Informasi curah hujan yang akurat penting untuk mitigasi bencana, pengelolaan sumber daya udara, dan pemodelan iklim. Pengukuran terhadap curah hujan dalapat dilakukan dengan berbagai metode, salah satunya dengan menggunakan metode jarak jauh yaitu radar (Radio Detecting and Ranging). Pada studi ini, dilakukan perhitungan radar cuara dengan menggunakan machine learning untuk mengkaji keakuratan perhitungan data radar cuaca terhadap nilai estimasi curah hujan di Pontianak. Produk dari radar cuaca merupakan data reflektifitas (Z). Penggunaan machine learning ini diterapkan pada data reflektifitas radar cuaca dimana data yang digunakan adalah C-MAX atau Column Maximum. Data curah hujan pada periode Desember 2021 sampai Februari 2022 di Pontianak diolah dengan metode perbandingan menggunakan empat algoritma tree-based machine learning: Decision Tree, Random Forest, Adaptive Boosting, dan Gradient Boosting. Perbandingan ini bertujuan untuk mendapatkan nilai estimasi curah hujan. Algoritma Decision Tree menghasilkan nilai akurasi RMSE sebesar 0,693 dan korelasi R2 sebesar 0,449; Random Forest menghasilkan RMSE 0,642 dan R2 0,527; Adaptive Boosting menghasilkan RMSE sebesar 0,725 dan R2 sebesar 0,395, serta Gradient Boosting menghasilkan RMSE sebesar 0,561 dan R2 sebesar 0,638. Disimpulkan bahwa algoritma Gradient Boosting dapat memberikan estimasi curah hujan terbaik di Pontianak, Kalimantan Barat, Indonesia. ......Equatorial regions have high rainfall because they are located near the equator, where the sun produces very high energy throughout the year. This impacts biological habitats, the global water cycle, and people's daily lives. Accurate rainfall information is vital for disaster mitigation, air resource management, and climate modeling. Rainfall can be measured using various methods, one of which is a long- range method, namely radar (Radio Detecting and Ranging). In this study, weather radar calculations were carried out using machine learning to assess the accuracy of weather radar data calculations on estimated rainfall values in Pontianak. The product of weather radar is reflectivity data (Z). Machine learning is applied to weather radar reflectivity data where the data used is C-MAX or Column Maximum. Rainfall data from December 2021 to February 2022 in Pontianak was processed utilizing a comparative method using four tree-based machine learning algorithms: Decision Tree, Random Forest, Adaptive Boosting, and Gradient Boosting. This comparison aims to obtain estimated rainfall values. The Decision Tree algorithm produces an RMSE accuracy value of 0.693 and an R2 correlation of 0.449; Random Forest produces an RMSE of 0.642 and R2 0.527; Adaptive Boosting produces an RMSE of 0.725 and R2 of 0.395, and Gradient Boosting has an RMSE of 0.561 and an R2 of 0.638. It was concluded that the Gradient Boosting algorithm can provide the best rainfall estimates in Pontianak, West Kalimantan, Indonesia.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam. Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
A Life Alva Permana
Abstrak :
Salah satu hal penting dalam bisnis asuransi adalah bagaimana perusahaan asuransi dapat menetapkan premi yang sesuai dengan ekspektasi kerugian dari pelanggan dan dapat bersaing di pasar. Untuk menetapkan premi tersebut, salah satu hal penting untuk dilakukan adalah memperkirakan besar klaim agregat. Masalah perkiraan besarnya klaim agregat merupakan masalah regresi. Salah satu metode yang sudah cukup berkembang untuk permasalahan regresi adalah Gradient Tree Boosting. Salah satu kekurangan dari metode Gradient Tree Boosting adalah metode ini tidak mengimplementasikan asumsi bahwa data memiliki distribusi. Sementara untuk data klaim agregat, dapat digunakan asumsi bahwa frekuensi klaim berdistribusi Poisson, severitas klaim berdistribusi Gamma, dan keduanya saling independen sehingga klaim agregat diasumsikan berdistribusi Tweedie. Gradient Tree Boosted Tweedie Model merupakan salah satu metode untuk menyelesaikan masalah regresi untuk klaim dengan asumsi-asumsi tersebut. Metode ini menggunakan algoritma Gradient Tree Boosting dengan menjadikan negatif fungsi log-likelihood dari distribusi Tweedie sebagai fungsi loss-nya. Didapatkan hasil bahwa asumsi klaim agregat berdistribusi Tweedie meningkatkan akurasi dari metode Gradient Tree Boosting.
One of the important things in insurance business is how will insurance company set a premium that could correspond insured’s expected loss while also being competitive in market. To set a proper premium for insurance customer, one of the important tasks is to estimate total loss or aggregate claim of the insured. Estimating the aggregate claim is a regression problem. One of many methods for regression problem is Gradient Tree Boosting. One of the weaknesses of Gradient Tree Boosting is, this method does not implement the assumption that the data might be distributed. While for aggregate claim, one can assume that the claim frequency is Poisson distributed, claim severity is Gamma distributed, and both are independent so that the aggregate claim could be assumed to be Tweedie distributed. Gradient Tree Boosted Tweedie Model is one of many methods for solving a regression problem for a claim with the assumption mentioned. This method uses Gradient Tree Boosting algorithm with the log-likelihood function of Tweedie distribution as it’s loss function. It was found that the assumption that the aggregate claim is Tweedie distributed improves the accuracy of Gradient Tree Boosting method.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rashifa Khairani Setianegara
Abstrak :
Curah hujan mempunyai dampak yang signifikan terhadap berbagai sektor kehidupan dan lingkungan. Misalnya, curah hujan membantu meningkatkan produktivitas pertanian, menjamin cadangan pangan dan air. Selain itu, curah hujan juga mempengaruhi kekeringan dan siklus air tanah. Oleh karena itu, mengetahui cara memperkirakan curah hujan di suatu daerah secara akurat sangat penting. Salah satu cara memperkirakan curah hujan adalah dengan menggunakan radar cuaca yang mengukur nilai reflektivitas, kemudian menggunakan persamaan Z-R untuk menghitung curah hujan yang terjadi. Namun, beberapa penelitian sebelumnya telah menggunakan model estimasi curah hujan kuantitatif dengan machine learning dari data radar hujan karena dapat memberikan prediksi yang lebih akurat dibandingkan persamaan Z-R. penelitian lain menyatakan bahwa gradient boosting menghasilkan estimasi curah hujan yang lebih akurat dibandingkan beberapa algoritma lainnya. Pada penelitian ini, estimasi curah hujan dilakukan pada satu wilayah dengan tipe curah hujan lokal di Kota Gorontalo. Estimasi ini dilakukan dengan membandingkan keakuratan dua metode: persamaan Z-R dan algoritma machine learning. Persamaan Z-R yang digunakan adalah persamaan Z-R oleh Marshall-Palmer (𝐴 = 200, 𝑏 = 1.6) dan Rosenfeld (𝐴 = 250, 𝑏 = 1.2), sedangkan algoritma machine learning yang digunakan adalah gradient boosting. Hasil perbandingan menunjukkan bahwa gradient boosting memberikan estimasi yang lebih akurat dibandingkan dengan kedua persamaan Z-R tersebut. Hasil estimasi algoritma gradient boosting memberikan nilai RMSE, MAE, dan R 2 masing-masing sebesar 0,61, 0,17, dan 0,86. Persamaan Marshall-Palmer Z-R menghasilkan nilai RMSE, MAE, dan R 2 sebesar 8,14, 3,66, dan -0,19. Estimasi persamaan Z-R Rosenfeld menghasilkan nilai RMSE, MAE, dan R 2 sebesar 8,18, 3,71, dan -0,20. Dari ketiga metrik tersebut, dapat disimpulkan bahwa gradient boosting memberikan estimasi yang paling akurat untuk curah hujan di wilayah dengan tipe hujan lokal di Kota Gorontalo. ......Rainfall has a significant impact on various sectors of life and the environment. For example, rainfall helps increase productivity in agriculture, ensuring food reserves and water. In addition, rainfall also affects drought and the soil water cycle. Therefore, knowing how to estimate rainfall in an area accurately is essential. One way to estimate rainfall is to use a weather radar that measures reflectivity values, then use the Z-R equation to calculate the rainfall that occurs. However, Several previous studies have used machine learning quantitative rainfall estimation models from rain radar data because it can provide more accurate predictions than the Z-R equation. Another study state that gradient boosting provides more accurate rainfall estimation than several other algorithms. In this study, rainfall estimation was carried out in an area with local rainfall types in Gorontalo City. This estimation is done by comparing the accuracy of two methods: the Z-R equation and machine learning algorithms. The Z-R equation used is the Z-R Equation by Marshall-Palmer (𝐴 = 200, 𝑏 = 1.6) and Rosenfeld (𝐴 = 250, 𝑏 = 1.2), while the machine learning algorithm used is gradient boosting. The comparison results show that gradient boosting provides a more accurate estimation than the two ZR equations. The gradient boosting algorithm estimation results provide RMSE, MAE, and R 2 values of 0.61, 0.17 and 0.86, respectively. The Marshall-Palmer Z-R equation obtained RMSE, MAE, and R 2 values of 8.14, 3.66, and -0.19. The estimation of Rosenfeld's Z-R equation resulted in RMSE, MAE, and R 2 values of 8.18, 3.71, and - 0.20. From these three metrics, it is concluded that gradient boosting provides the most accurate estimate for rainfall in areas with localized rainfall types in Gorontalo City.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ghifari Gagah Dahana
Abstrak :
Sampai sekarang, sebagian besar orang masih menganggap kepemilikan rumah sebagai kebutuhan primer yang belum bisa ditandingi oleh pilihan hunian lain. Harga rumah biasanya ditentukan oleh berbagai faktor seperti lokasi, kondisi makro ekonomi, serta kondisi fisik rumah. Banyaknya faktor tersebut membuat penentuan valuasi rumah secara objektif menjadi sulit. Dalam beberapa tahun terakhir, penelitian mengenai estimasi harga rumah telah berkembang pesat, dengan metode machine learning menjadi yang paling sering digunakan. Oleh karena itu, penelitian ini menggunakan salah satu algoritma machine learning yang sudah terbukti dapat mendapatkan akurasi tinggi, yaitu stacked generalization. Penelitian ini menggabungkan beberapa variabel yang digunakan oleh penelitian-penelitian sebelumnya untuk memprediksi valuasi rumah. Model stacked generalization yang dibangun akan dibandingkan dengan algoritma lain yang juga sering digunakan dalam memprediksi valuasi rumah, diantaranya adalah regresi linear, random forest, gradient boosting machine, dan extreme gradient boosting. Hasil penelitian menunjukkan bahwa algoritma stacked generalization memiliki kemampuan prediksi yang lebih baik dibandingkan metode lainnya dengan hasil R2 sebesar 0,881, dan MAPE sebesar 0,21%. Selanjutnya dilakukan analisis terhadap faktor yang paling berpengaruh terhadap perubahan valuasi rumah menggunakan teknik permutation feature importance. Faktor-faktor yang paling berpengaruh adalah luas tanah, luas bangunan, jarak menuju pusat perbelanjaan, kapasitas listrik, dan Indeks Harga Perumahan Residensial. ......In recent years, homeownership remains a primary need that other housing options have yet to match. House prices are typically determined by various factors such as location, macroeconomic conditions, and the physical state of the house. These numerous factors make objective house valuation challenging. Recently, research on house price estimation has advanced significantly, with machine learning methods being the most commonly used. Therefore, this study employs one proven machine learning algorithm with high accuracy, stacked generalization. This research incorporates several variables used by previous studies to predict house valuations. The stacked generalization model developed is compared with other frequently used algorithms for predicting house valuations, including linear regression, random forest, gradient boosting machine, and extreme gradient boosting. The results show that the stacked generalization algorithm has superior predictive ability compared to other methods, with an R2 of 0.881 and MAPE of 0.21%. Subsequently, an analysis of the factors most influencing changes in house valuation was conducted using permutation feature importance techniques. The most influential factors are land area, building area, distance to shopping centers, electricity capacity, and the Residential Property Price Index.
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3   >>