Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 68962 dokumen yang sesuai dengan query
cover
Agus Widodo
"Saat ini penentuan area riset masih banyak bergantung kepada pendapat para ahli. Meskipun ahli tersebut memiliki pengetahuan yang mendalam di bidangnya, akan tetapi tidak semua area riset yang emerging dapat diketahui oleh ahli tersebut mengingat cepatnya perkembangan sumber-sumber informasi tentang ilmu pengetahuan dan teknologi. Namun demikian, analisis data yang berjumlah besar memerlukan waktu yang lama dan bisa jadi subyektif jika menggunakan cara manual. Beberapa penelitian sebelumnya telah menggunakan teknik kuantitatif dengan menghitung trend berdasarkan jumlah kata kunci dari suatu topik riset dan memprediksi trend tersebut untuk masa yang akan datang. Untuk prediksi trend dari data time series, saat ini pendekatan machine learning mulai banyak dikaji disamping pendekatan statistik yang sebelumnya lazim digunakan.
Sementara itu, pendekatan ensemble yang menggabungkan hasil prediksi, teknik prediksi atau representasi data diyakini dapat meningkatkan akurasi prediksi. Multiple Kernel Learning (MKL) merupakan suatu teknik ensemble melalui penggabungan kernel yang menggunakan teknik machine learning, yakni Support Vector Machine (SVM), sebagai classifier atau prediktor. Dalam penelitian sebelumnya, MKL telah dimanfaatkan untuk menggabungkan fitur, yang biasa disebut sebagai data integration, dalam bidang image processing tetapi masih menggunakan single kernel. Dalam penelitian ini, MKL dimanfaatkan untuk menggabungkan fitur data time series yang berupa sliding windows dan diterapkan pada multiple kernel. Disamping itu, penelitian ini juga mengajukan penggunaan data historis sebagai pengganti training dataset untuk memilih model prediksi yang sesuai dengan karakteristik time series karena setiap model prediksi memiliki kelebihan dan keterbatasan dalam memprediksi data time series yang jenisnya cukup beragam.

Currently, the determination of the research area is still largely dependent on the opinion of experts. Although experts have in-depth knowledge in the field, but not all areas of emerging research can be known by the experts given the rapid development of sources of information regarding science and technology. However, the analysis of large amounts of data would take a quite long time and the result could be subjective if a manual method is employed. Several previous studies have used quantitative techniques to calculate trends based on the number of keywords on research topics and forecast their future trends. For the trend forecasting of time series data, currently, machine learning approaches have been extensively studied in addition to the previous statistical approaches which are commonly used.
Meanwhile, an ensemble approach that may combine the prediction results, prediction techniques or data representations has the capability to increase the prediction accuracy. Multiple Kernel Learning (MKL) is one of such ensemble methods that optimizes the combination of kernels through the use of machine learning technique, such as Support Vector Machine (SVM), as a classifier or predictor. In previous studies, MKL has been used to combine features, which is commonly referred to as the data integration approach, in the field of image processing but is still implemented on a single kernel. In this study, MKL is used to combine the features of time series data in the form of sliding windows and tested on multiple kernels. In addition, this study also proposes the use of historical data as a substitute for the training dataset to select the prediction technique based on the characteristics of time series considering the diverse kind of time series data such that no single prediction technique can be used for all types of data."
Depok: Universitas Indonesia, 2014
D1972
UI - Disertasi Membership  Universitas Indonesia Library
cover
Kinanthy Dwi Pangesty
"Manajemen rumah sakit yang baik dapat meningkatkan kualitas pelayanan medis. Rumah sakit merupakan institusi pelayanan kesehatan yang menyelenggarakan pelayanan kesehatan perorangan secara paripurna yang menyediakan pelayanan rawat inap, rawat jalan, dan gawat darurat. Rumah sakit diharuskan untuk mengelola berbagai jenis sumber daya untuk meningkatkan efisiensi manajemen secara keseluruhan, seperti mengelola jadwal tim dan staf medis, manajemen tempat tidur, dan jalur perawatan. Penyakit jantung merupakan penyakit penyebab kematian tertinggi di dunia yang sangat membutuhkan penanganan medis dengan segera. Penyakit jantung membutuhkan salah satu pelayanan pada rumah sakit yaitu pelayanan rawat inap. Pelayanan rawat inap melibatkan sumber daya yang berkaitan dengan biaya dan waktu. Dengan adanya prediksi durasi rawat inap pada pasien penyakit jantung akan membantu pihak pasien dalam menyiapkan kebutuhan yang diperlukan serta pihak rumah sakit dalam manajemen tempat tidur rawat inap pasien penyakit jantung. Pada penelitian ini, dilakukan prediksi durasi rawat inap pasien penyakit jantung dengan menggunakan pendekatan ensemble machine learning dengan tujuan untuk mendapatkan metode terbaik dalam memprediksi dengan membandingkan dua metode ensemble machine learning yaitu random forest dan extreme gradient boosting, serta metode logistic regression sebagai baseline. Kemudian tujuan lainnya yaitu untuk mengetahui faktor yang paling berpengaruh terhadap durasi rawat inap. Ketiga metode yang digunakan merupakan bagian dari supervised machine learning. Selain itu, dilakukan optimasi hyperparameter untuk meningkatkan performa dari hasil model prediksi. Setelah membuat model prediksi dan melakukan evaluasi terhadap model, didapatkan metode terbaik yaitu random forest dengan optimasi hyperparameter yang mendapat hasil akurasi sebesar 83,9% dan nilai AUROC sebesar 92,86% serta faktor-faktor yang paling berpengaruh terhadap durasi rawat inap antara lain jumlah limfosit total, urea, trombosit, hemoglobin, glukosa, usia, kreatinin, peptida natriuretik otak, fraksi ejeksi dan hipertensi.

Good hospital management can improve the quality of medical services. The hospital is a health service institution that provides complete individual health services in inpatient, outpatient, and emergency services. Hospitals are required to manage various types of resources to improve overall management efficiency, such as managing medical team and staff schedules, bed management, and clinical pathways. Heart disease is the leading cause of death in the world and requires immediate medical treatment. Heart disease requires one of the services at the hospital, namely inpatient services. Inpatient services involve resources related to cost and time. Predicting the duration of hospitalization in heart disease patients will help the patient prepare for the necessary needs and the hospital in managing inpatient beds for heart disease patients. In this study, the prediction of the duration of hospitalization for heart disease patients using an ensemble machine learning approach was carried out with the aim of getting the best method of predicting by comparing two ensemble machine learning methods, namely random forest and extreme gradient boosting, as well as the logistic regression method as a baseline. Then another goal is to find out the most influential factors on the duration of hospitalization. The three methods used are part of supervised machine learning. In addition, hyperparameter optimization is carried out to improve the performance of the prediction model results. After making a predictive model and evaluating the model, the best method was obtained, namely random forest with hyperparameter optimization which obtained an accuracy of 83.9% and an AUROC value of 92.86% and the factors that most influence the duration of hospitalization include the number of total lymphocytes, urea, platelets, hemoglobin, glucose, age, creatinine, brain natriuretic peptide, ejection fraction and hypertension.
"
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Mohamad Irvan Septiar Musti
"ABSTRAK
HIV Human Immunodeficiency Virus adalah sebuah jenis retrovirus obligat intraseluler yang menyerang sistem kekebalan tubuh manusia. Virus ini menyerang dengan cara melakukan interaksi antara protein virus dengan protein manusia. Penelitian ini menggunakan data berupa barisan asam amino dari protein yang akan diubah fiturnya menggunakan metode global encoding. Hasil ekstraksi fitur tersebut kemudian akan digunakan sebagai masukan untuk metode rotation forest guna memprediksi interaksi protein HIV dengan manusia. Selain itu pula, penelitian ini juga membandingkan performa metode rotation forest yang menggunakan Principal Component Analysis RF PCA dengan rotation forest yang menggunakan Independent Principal Component Analysis RF IPCA sebagai metode transformasi peubah bebas dalam metode tersebut. Hasil dari penelitian ini menunjukkan bahwa RF PCA memperoleh hasil performa tertinggi dalam memprediksi interaksi protein HIV dengan protein manusia, yaitu dengan nilai akurasi sebesar 79,50 , sensitivitas 79,91 , spesifisitas 79,07 dan presisi sebesar 79,77 . Sementara itu, metode RF IPCA memperoleh hasil performa tertinggi yaitu dengan nilai akurasi sebesar 77,20 , sensitivitas 76,65 , spesifisitas 77,81 , dan presisi sebesar 79,40 . Selain itu pula, dalam penelitian ini ditemukan sebanyak 2.619 protein manusia yang terprediksi berinteraksi dengan protein HIV melalui model terbaik RF PCA , dan juga ditemukan sebanyak 3.071 protein manusia yang terprediksi berinteraksi dengan protein HIV melalui model terbaik RF IPCA dari total sebanyak 7.678 protein manusia yang diteliti.

ABSTRACT
HIV Human Immunodeficiency Virus is a type of retrovirus obligate intracellular that attacks the human body 39 s immune system. This virus attacks by doing interaction between virus and human proteins. This research uses data of amino acids sequence from protein that the feature will be extracted using Global Encoding. The result of feature extraction then would be used as an input for Rotation Forest in order to predict interaction between HIV and human proteins. In addition, this research also compares the performance of Rotation Forest that using Principal Component Analysis RF PCA with Independent Principal Component Analysis RF IPCA as a method of transformation in that method. The result shows that RF PCA produced highest performance in classifying protein interactions between HIV and human, with accuracy value of 79,50 , 79,91 sensitivity, 79,07 specificity and 79,77 precision. While the RF IPCA produced highest performance with 77,20 accuracy, 76,65 sensitivity, 77,81 specificity, and 79,40 precision. In addition, there are 2.619 human protein which is predicted has an interaction with HIV protein through RF PCA best model, and there are 3.071 human protein which is predicted has an interaction with HIV protein through RF IPCA best model from the total of 7.678 human protein. All of that can be found in this research."
2018
T49480
UI - Tesis Membership  Universitas Indonesia Library
cover
Shirley Aprilia
"ABSTRAK
Protein adalah salah satu biomakromolekul yang mempunyai peran sangat penting dalam organisme hidup. Semua jenis protein terdiri dari serangkaian kombinasi 20 asam amino. Interaksi Protein-Protein Interaksi PPI memainkan peran penting dalam sebagian besar proses biologis sehingga deteksi interaksi protein-protein PPI pada dasarnya penting untuk memahami mekanisme molekuler dalam sistem biologis. Dengan menggunakan proses komputasi dan menerapkan metode pembelajaran mesin, akan lebih efisien daripada metode eksperimental yang membutuhkan waktu lama dan biaya mahal. Dalam tesis ini penulis menggunakan Discrete Cosine Transform sebagai metode fitur ekstraksi barisan asam amino dan Rotation Forest sebagai model klasifikasi untuk mendapatkan kinerja yang lebih baik daripada metode sebelumnya, seperti Support Vector Machine, Random Forest, dan lain-lain. Hal baru dalam tulisan ini terletak pada interaksi protein protein dengan virus HIV yang menyebabkan AIDS. Hasil penelitian menunjukkan bahwa metode yang diusulkan layak dilakukan, kuat dan dapat digunakan untuk prediksi interaksi protein-protein lainnya dengan akurasi hingga 77 dan metode transformasi Rotation Forest yang menggunakan PCA lebih baik dibandingkan metode transformasi Rotation Forest yang menggunakan IPCA. Terdapat 962 protein yang berpotensi berinteraksi pada PCA dari 4529 potein dan 2902 protein pada IPCA dari 7499 protein.

ABSTRACT
Protein is one of the bio macromolecules that have a very important role in living organisms. All types of proteins consist of a series of combinations of 20 amino acids. Interaction of Protein Protein Interactions PPI plays an important role in most biological processes so that the detection of protein protein interactions PPIs is basically important for understanding molecular mechanisms in biological systems. By using computational processes and applying machine learning methods, it will be more efficient than experimental methods that take a long time and costly. In this thesis the author uses Discrete Cosine Transform as a method of extraction of amino acid sequences and Rotation Forest as a prediction model to get better performance than previous methods, such as Support Vector Machine, Random Forest, etc . The novelty in this paper lies in the interaction of protein proteins with the HIV virus that causes AIDS. The results show that the proposed method is feasible, robust and can be used for the classification of other protein interactions with up to 77 accuracy and Rotation Forest transformation methods using PCA better than Rotation Forest transformation methods using IPCA. There are 962 potentially interacting proteins in the PCA of 4529 potein and 2902 proteins in IPCA of 7499 proteins."
2018
T49487
UI - Tesis Membership  Universitas Indonesia Library
cover
Maria Angelica Christabel
"Poverty is still a serious challenge for all countries in the world, including Indonesia. The Central Statistics Agency (BPS) noted that 25.9 million people were still living in poverty as of March 2023. The challenge of inefficient and poorly targeted budget distribution in some programs hampers poverty alleviation efforts. In line with that, the objective of this study is to categorize provinces based on poverty indicators to provide an understanding of the characteristics and patterns of poverty in various Indonesian provinces. This research uses the Link-based Cluster Ensemble method, which combines various solutions from different clustering methods, namely K-medoids and Agglomerative Hierarchical Clustering to obtain more optimal results. The final result of ensemble clustering is obtained through a similarity matrix by applying the Connected-Triple-based Similarity (CTS) algorithm, which utilizes pairwise similarity relationships between all data points. The data for this study comes from BPS regarding Poverty Data in Indonesia in 2023, with the selection of variables that can reveal the characteristics of poverty in Indonesia, such as aspects of education, employment, expenditure, and household facilities. The results showed that the Link-based Cluster Ensemble method, which was formed through a three-member ensemble from the results of K-Medoids and Agglomerative Hierarchical Clustering, successfully outperformed the single clustering method based on cluster evaluation values using Silhouette, Davies-Bouldin, and Dunn Index. The results grouped the provinces into four clusters: Cluster 1 reveals poverty conditions with low education participation and sanitation facilities, Cluster 2 with low education and high expenditure, Cluster 3 with high unemployment, and Cluster 4 with low clean water facilities.

Kemiskinan masih menjadi tantangan serius bagi seluruh negara di dunia, termasuk Indonesia. Badan Pusat Statistik(BPS) mencatat sebanyak 25,9 juta masyarakat masih hidup dalam kemiskinan per Maret 2023. Tantangan dalam penyaluran anggaran yang tidak efisien dan tepat sasaran pada beberapa program menghambat upaya pengentasan kemiskinan. Sejalan dengan hal itu, tujuan dari penelitian ini adalah mengelompokkan provinsi berdasarkan indikator kemiskinan untuk memberikan pemahaman tentang karakteristik dan pola kemiskinan di berbagai provinsi Indonesia. Penelitian ini menggunakan metode Link-based Cluster Ensemble, yang menggabungkan berbagai solusi dari metode pengelompokan berbeda, yaitu K-medoids dan Agglomerative Hierarchical Clustering untuk mendapatkan hasil yang lebih optimal. Hasil akhir pengelompokan ensemble diperoleh melalui similarity matrix dengan menerapkan algoritma Connected-Triple-based Similarity (CTS), yang memanfaatkan hubungan kesamaan berpasangan antara seluruh titik data. Data penelitian ini berasal dari BPS mengenai Data Kemiskinan di Indonesia tahun 2023, dengan pemilihan variabel yang dapat mengungkapkan karakteristik kemiskinan di Indonesia, seperti aspek pendidikan, ketenagakerjaan, pengeluaran konsumsi, dan fasilitas rumah tangga. Hasil penelitian menunjukkan bahwa metode Link-based Cluster Ensemble, yang dibentuk melalui tiga anggota ensemble dari hasil pengelompokan K-Medoids dan Agglomerative Hierarchical Clustering, berhasil mengungguli metode pengelompokan tunggal berdasarkan nilai evaluasi cluster menggunakan Silhouette, Davies-Bouldin, dan Dunn Index. Hasil penelitian mengelompokkan provinsi ke dalam empat cluster: Cluster 1 mengungkapkan kondisi kemiskinan dengan aspek partisipasi pendidikan dan fasilitas sanitasi yang rendah, Cluster 2 dengan kondisi aspek pendidikan yang rendah dan pengeluaran konsumsi yang tinggi, Cluster 3 dengan kondisi pengangguran yang tinggi, dan Cluster 4 dengan kondisi fasilitas air bersih yang rendah."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dian Wulan Hastuti
"Prediksi konsentrasi analit urin telah berhasil dikembangkan menggunakan kertas kolorimetri berbasis ponsel pintar Android dengan metode regresi ensemble learning. Beberapa pengembangan yang dilakukan pada penelitian ini meliputi segmentasi citra secara otomatis, koreksi citra menggunakan metode RPCC, dan pengembangan model regresi untuk prediksi 3 (tiga) analit urin, yaitu glukosa, pH dan protein. Model regresi tersebut selanjutnya divalidasi dengan performa terbaik pada sampel urin responden yang rentan terhadap perubahan warna. Pada penelitian ini, persiapan urin buatan dilakukan dengan membuat konsentrasi 0-2.000 mg/dl untuk analit glukosa dan protein. Selain itu, larutan pH buffer 5–9 juga digunakan untuk kepentingan analisa pH. Model regresi yang dikembangkan berbasis mesin pembelajaran ensemble dengan optimasi boosting. Selain itu, aplikasi berbasis server juga dikembangkan menggunakan aristektur RESTful API dengan 2 (dua) server, yaitu server unggah menggunakan Node.js dan server komputasi menggunakan MATLAB Production Server. Hasil yang diperoleh adalah performa R2 sebesar 0,98, 0,99 dan 0,98 serta nilai RMSRE sebesar 0,04, 0,03 dan 0,07 untuk masing-masing analit glukosa, pH dan protein. Tingkat keberhasilan aplikasi adalah 100% pada Samsung Galaxy A51 dan Huawei Nova 5T. Penelitian ini mampu memprediksi konsentrasi glukosa, pH dan protein dengan baik sehingga dapat dijadikan alternatif aplikasi pemantauan kesehatan.

Prediction of urine analyte concentration has been successfully developed based on an Android smartphone using colorimetric paper with the ensemble learning regression method. Some of the developments in our study include automatic image segmentation, image correction using the RPCC method, and the development of a regression model for the prediction of 3 (three) urine analytes, namely glucose, pH, and protein. Furthermore, the model was successfully validated for best performance in the respondent's urine susceptible to color change. We used artificial urine at a concentration of 0-2.000 mg/dl for glucose and protein samples for this study. In addition, pH buffer solutions 5–9 are also used for urine pH analysis. The regression model developed is based on ensemble learning with boosting optimization method. In addition, server-based applications are also developed using RESTful API architecture with (2) two servers, the upload server using Node.js and the computing server using the MATLAB Production Server. As a result, the R2 performance for glucose, pH and protein analytes were 0,98, 0,99 and 0,98 and RMSRE were 0,04, 0,03 dan 0,07, respectively. The Android application success rate was 100% on Samsung Galaxy A51 and Huawei Nova 5T. This study estimates that glucose, pH, and protein levels are good enough for health monitoring applications."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Melati Vidi Jannati
"Klasifikasi data kanker menggunakan microarray data menjadi salah satu cara untuk mendapatkan pengobatan yang lebih tepat. Kendala yang terdapat adalah karakteristik dari microarray yang memiliki fitur yang sangat banyak. Seringkali fitur tersebut tidak begitu informatif bagi pengklasifikasian sehingga perlu adanya suatu cara untuk memilih fitur-fitur yang mengandung informasi yang penting. Salah satu cara tersebut adalah dengan pemilihan fitur. Pada penelitian ini, metode pemilihan fitur yang digunakan berdasarkan clustering dengan fungsi kernel. Fitur-fitur yang sudah terpilih kemudian diklasifikasikan menggunakan metode Support Vector Machine.
Evaluasi dari klasifikasi pada penelitian ini melibatkan K-Fold Cross Validation, metode tersebut akan membagi data secara acak, tetapi merata sehingga akurasi yang didapat juga merata. Hasil akurasi tersebut dilakukan dengan berbagai uji terhadap parameter yang berkaitan seperti K partisi, nilai dan fitur-fitur yang digunakan. Pada proses klasifikasi tanpa pemilihan fitur tingkat akurasinya mencapai 89.68 dengan k partisi sebanyak 6 sementara dengan 5 fitur akurasinya menjadi 95.87 pada partisi sebanyak 10.

Classification of cancer using microarray data is one way to get a more precise treatment. The obstacle on classification data is the characteristics of microarray data that is having many features. These features are often not so informative for classification, so it needs a way to select the features that contain important information. One way is by selection feature. In this research, the method of selection features that are used based on clustering with kernel function. Features that are already selected then classified using Support Vector Machine.
Evaluation of classification in this research involves a K Fold Cross Validation, that methods split data randomly but uniformly so that it can reach all of accuracy. The results of accuracy data was done with different test against related parameters such as K partition, the value of and the features that are used. On the classification process without selection features rate of accuracy reached on 89.68 with k partition number 6 while with the 5 features obtained 95.87 on partition number 10.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
S66852
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rafiqatul Khairi
"Kanker pankreas adalah penyakit di mana sel-sel tumor ganas (kanker) berkembang di jaringan pankreas, yaitu organ di belakang perut bagian bawah dan di depan tulang belakang, yang membantu tubuh menggunakan dan menyimpan energi dari makanan dengan memproduksi hormon untuk mengontrol kadar gula darah dan enzim pencernaan untuk memecah makanan. Biasanya, kanker pankreas jarang terdeteksi pada tahap awal. Salah satu tanda seseorang mengalami kanker pankreas adalah diabetes, terutama jika itu bertepatan dengan penurunan berat badan yang cepat, penyakit kuning, atau rasa sakit di perut bagian atas yang menyebar ke punggung. Di antara berbagai jenis kanker, kanker pankreas memiliki tingkat kelangsungan hidup terendah, yaitu hanya sekitar 3-6% dari mereka yang didiagnosis yang dapat bertahan hidup selama lima tahun. Jika pasien didiagnosis tepat waktu untuk perawatan, peluang mereka untuk bertahan hidup akan meningkat. Terdapat penanda tumor yang biasa digunakan untuk mengikuti perkembangan kanker pankreas, yaitu CA 19-9 yang dapat diukur dalam darah. Orang sehat dapat memiliki sejumlah kecil CA 19-9 dalam darah mereka. Kadar CA 19-9 yang tinggi seringkali merupakan tanda kanker pankreas. Tetapi kadang-kadang, kadar tinggi dapat menunjukkan jenis kanker lain atau gangguan non-kanker tertentu, seperti sirosis dan batu empedu. Karena kadar CA 19-9 yang tinggi tidak spesifik untuk kanker pankreas, CA 19-9 tidak dapat digunakan dengan sendirinya untuk skrining atau diagnosis. Ini dapat membantu memantau perkembangan kanker dan efektivitas pengobatan kanker. Dalam studi ini, metode Kernel-based Support Vector Machine digunakan untuk mengklasifikasikan hasil tes darah CA19-9 menjadi dua bagian; data pasien yang didiagnosis dengan kanker pankreas atau pasien normal (tidak terdiagnosis kanker pankreas). Metode ini memperoleh akurasi sekitar 95%.

Pancreatic cancer is a disease in which malignant (cancerous) tumor cells develop in pancreatic tissue; organ behind the lower abdomen and in front of the spine, which helps the body use and store energy from food by producing hormones to control blood sugar levels and digestive enzymes to break down food. Usually, pancreatic cancer is rarely detected at an early stage. One sign of a person with pancreatic cancer is diabetes, especially if it coincides with rapid weight loss, jaundice, or pain in the upper abdomen that spreads to the back. Among various types of cancer, pancreatic cancer has the lowest survival rate of only about 3-6% of those diagnosed who can survive for five years. If patients are diagnosed on time for treatment, their chances of survival will increase. There is a tumor marker commonly used to follow the course of pancreatic cancer, namely CA 19-9 which can be measured in the blood. Healthy people can have small amounts of CA 19-9 in their blood. High levels of CA 19-9 are often a sign of pancreatic cancer. But sometimes, high levels can indicate other types of cancer or certain noncancerous disorders, including cirrhosis and gallstones. Because a high level of CA 19-9 is not specific for pancreatic cancer, CA 19-9 cannot be used by itself for screening or diagnosis. It can help monitor the progress of your cancer and the effectiveness of cancer treatment. In this study, the Kernel-based Support Vector Machine method is used to classify CA19-9 blood test results into two sections including data on patients diagnosed with pancreatic cancer or normal patients. This method will get an accuracy of around 95%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
"Beberapa metode telah diajukan untuk menggabungkan beberapa hasil forecasting dalam single forecast yang diberi nama simple averaging, pemberian rata-rata dengan bobot pada tahap validasi kinerja, atau skema kombinasi non-parametrik. Metode ini menggunakan kombinasi tetap pada individual forecast untuk mendapatkan hasil final dari forecast. Dalam paper ini, pendekatan berbeda digunakan untuk memilih metode forecasting, di mana setiap titik dihitung dengan menggunakan metode terbaik yang digunakan oleh dataset pelatihan sejenis. Dengan demikian, metode yang dipilih dapat berbeda di setiap titik perkiraan. Similarity measure yang digunakan untuk membandingkan deret waktu untuk pengujian dan validasi adalah Euclidean dan Dynamic Time Warping (DTW), di mana setiap titik yang dibandingkan diberi bobot sesuai dengan keterbaruannya. Dataset yang digunakan dalam percobaan ini adalah data time series yang didesain untuk NN3 Competition dan data time series yang di-generate dari paten-paten USPTO dan publikasi ilmiah PubMed di bidang kesehatan, yaitu pada Apnea, Aritmia, dan Sleep Stages. Hasil percobaan menunjukkan bahwa pemberian kombinasi bobot dari metode yang dipilih berdasarkan kesamaan antara data pelatihan dan data pengujian, dapat menyajikan hasil yang lebih baik dibanding salah satu kombinasi metode unweighted yang dipilih berdasarkan similarity measure atau kombinasi tetap dari individual forecast terbaik.

Abstract
Several methods have been proposed to combine the forecasting results into single forecast namely the simple averaging, weighted average on validation performance, or non-parametric combination schemas. These methods use fixed combination of individual forecast to get the final forecast result. In this paper, quite different approach is employed to select the forecasting methods, in which every point to forecast is calculated by using the best methods used by similar training dataset. Thus, the selected methods may differ at each point to forecast. The similarity measures used to compare the time series for testing and validation are Euclidean and Dynamic Time Warping (DTW), where each point to compare is weighted according to its recentness. The dataset used in the experiment is the time series data designated for NN3 Competition and time series generated from the frequency of USPTO?s patents and PubMed?s scientific publications on the field of health, namely on Apnea, Arrhythmia, and Sleep Stages. The experimental result shows that the weighted combination of methods selected based on the similarity between training and testing data may perform better compared to either the unweighted combination of methods selected based on the similarity measure or the fixed combination of best individual forecast."
[Fakultas Ilmu Komputer Universitas Indonesia, Fakultas Ilmu Komputer Universitas Indonesia], 2012
pdf
Artikel Jurnal  Universitas Indonesia Library
cover
Tanjung, Alfian Rizqy
"Terdapat beberapa cara untuk memprediksi harga saham, ada yang menggunakan analisis runtun waktu, harga saham terdahulu, maupun menggunakan indikator teknis. Indikator teknis merupakan perhitungan matematis terhadap harga atau volume transaksi saham yang hasilnya dapat digunakan untuk memahami kecenderungan harga saham. Regresi ridge merupakan suatu metode regresi yang mampu mengatasi masalah dimana variabel-variabel regresornya tidak bebas linier. Regresi kernel ridge merupakan kombinasi antara regresi ridge dengan metode kernel dengan tujuan agar dapat memberikan hasil prediksi yang lebih baik. Pada skripsi ini, metode regresi ridge dan regresi kernel ridge akan diimplementasikan untuk memprediksi harga saham pada 12 perusahaan. Hasil percobaan menunjukkan bahwa metode regresi kernel ridge memberikan akurasi yang lebih baik daripada metode regresi ridge untuk beberapa perusahaan.

There are various way for predicting stock prices, some using time series analysis, past stock prices, or technical indicator. Technical indicator is a mathematical calculation over the stock prices or stock transaction volume that can be used to understand the stock price trend. Ridge regression is a regression method that can be used to solve the problem when some of the regressor variables are linearly dependent. Kernel ridge regression is a combination of ridge regression and kernel method in purpose to get better prediction. This skripsi will implement ridge regression and kernel ridge regression for stock prices forecasting of 12 companies. The result shows that kernel ridge regression gives better accuracy for stock price forecasting than ridge regression for some companies."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2013
S46703
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>