Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 217722 dokumen yang sesuai dengan query
cover
cover
Sihombing, Hobby Rajiman
Depok: Universitas Indonesia, 2003
S27453
UI - Skripsi Membership  Universitas Indonesia Library
cover
Vima Majesta Tingginehe
"ABSTRAK
Data yang tidak lengkap merupakan salah satu masalah yang sering muncul dalam penelitian medis, yang dapat mengakibatkan statistik inferensial tidak akurat. Salah satu cara yang dapat dilakukan untuk mengatasi masalah tersebut adalah dengan mengestimasi missing value yang terdapat pada data. Metode ini disebut imputasi. Beberapa metode imputasi telah dikembangkan untuk memperkirakan nilai yang hilang, dan salah satu metode imputasi yang paling sering digunakan adalah imputasi pohon keputusan. Pohon keputusan adalah salah satu metode pembelajaran mesin terawasi yang paling sederhana, yang digunakan untuk mengklasifikasikan dan meregresi data. Namun selain kepraktisan metode pohon keputusan untuk imputasi, metode ini kurang tepat jika muncul nilai-nilai yang hilang baik pada data latih maupun data pengujian secara bersamaan. Untuk mengatasi keterbatasan tersebut, metode imputasi pohon keputusan kemudian dikembangkan menjadi metode imputasi pohon atribut yang dipesan secara dinamis (DOAT). DOAT pertama kali diperkenalkan oleh Nick Street dan Jing Wang pada tahun 2009, untuk membangun sejumlah pohon keputusan yang digunakan untuk memperkirakan nilai yang hilang secara bertahap dalam data pelatihan. Selanjutnya tingkat akurasi estimasi akan digunakan untuk menentukan pohon keputusan akhir sebagai pohon keputusan terakhir yang melakukan imputasi. Setelah pohon keputusan akhir diperoleh dari data pelatihan, maka nilai-nilai yang hilang pada data pengujian akan diestimasi menggunakan sejumlah pohon keputusan yang dihasilkan dari data pelatihan, dimana pohon keputusan akhir yang dihasilkan pada data pelatihan juga merupakan pohon keputusan final. pohon keputusan yang digunakan dalam imputasi pengujian data. Pada penelitian ini dikembangkan metode imputasi DOAT dengan algoritma CART untuk membangun pohon keputusan untuk mengestimasi missing value pada data kategori penyakit. Kinerja metode imputasi DOAT akan dievaluasi berdasarkan tingkat akurasi menggunakan pohon keputusan. Hasil penelitian ini menunjukkan bahwa metode imputasi DOAT tidak mengurangi tingkat akurasi metode klasik yang sudah memiliki data lengkap.
ABSTRACT
Incomplete data is one of the problems that often arises in medical research, which can result in inaccurate inferential statistics. One way that can be done to overcome this problem is to estimate the missing value contained in the data. This method is called imputation. Several imputation methods have been developed to estimate missing values, and one of the most frequently used imputation methods is decision tree imputation. Decision trees are one of the simplest supervised machine learning methods, which are used to classify and regress data. However, in addition to the practicality of the decision tree method for imputation, this method is not appropriate if missing values ​​appear in both training data and test data simultaneously. To overcome these limitations, the decision tree imputation method was later developed into a dynamically ordered attribute tree (DOAT) imputation method. DOAT was first introduced by Nick Street and Jing Wang in 2009, to construct a number of decision trees that are used to estimate the incrementally missing values ​​in training data. Furthermore, the level of accuracy of the estimate will be used to determine the final decision tree as the last decision tree that performs imputation. After the final decision tree is obtained from the training data, the missing values ​​in the test data will be estimated using a number of decision trees generated from the training data, where the final decision tree generated in the training data is also the final decision tree. decision tree used in the imputation of data testing. In this study, the DOAT imputation method with the CART algorithm was developed to build a decision tree to estimate the missing value in disease category data. The performance of the DOAT imputation method will be evaluated based on the level of accuracy using a decision tree. The results of this study indicate that the DOAT imputation method does not reduce the level of accuracy of the classical method which already has complete data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Samsul Efendi
"Tugas akhir ini bertujuan membahas model asosiasi yang merupakan pengembangan Model Loglinier, untuk dua variabel kategorik yang salah satu atau keduanya berskala ordinal; yaitu nominal-ordinal, ordinal-nominal dan ordinal-ordinal. Model-model yang sesuai untuk kombinasi variabel tersebut adalah Model Uniform (Model U), Model Efek Baris (Model R), dan Model Efek Kolom (Model C). Model-model asosiasi tersebut bertujuan untuk menganalisis asosiasi antara dua variabel kategorik, dengan memasukkan sifat keterurutan dari variabel berskala ordinal dalam analisis. Masing-masing model akan memuat taksiran nilai harapan dan statistik goodness of fit. Contoh penggunaan masing-masing model dilakukan pada data kategorik dengan skala pengukuran ordinal-ordinal, nominal-ordinal, dan ordinal-nominal, disertai interpretasi hasil-hasil pemodelan. "
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2006
S27654
UI - Skripsi Membership  Universitas Indonesia Library
cover
Jakarta: Departemen kesehatan RI Pusat Data Kesehatan, 2000
001.64 IND t
Buku Teks SO  Universitas Indonesia Library
cover
cover
Suci Fitriyani
"Analisis sentimen merupakan studi komputasi untuk menganalisis opini seseorang terhadap suatu entitas yang diekspresikan dalam sebuah teks. Tersedia cukup banyak model machine learning terutama deep learning yang dapat digunakan untuk melakukan analisis sentimen seperti Convolutional Neural Network (CNN) dan Bidirectional Long Short-Term Memory (BiLSTM). Pada dasarnya, model deep learning tidak dapat memproses langsung sebuah data dalam bentuk teks sehingga diperlukan metode untuk mentransformasi teks menjadi tensor numerik seperti word embedding. Pada penelitian ini, diajukan model gabungan CNN-BiLSTM dengan word embedding fastText untuk melakukan analisis sentimen. Model tersebut dilatih menggunakan data tweet berbahasa Indonesia tentang opini masyarakat mengenai rencana subsidi pembelian kendaraan listrik di Indonesia. Data tersebut diklasifikasikan menjadi sentimen positif, negatif, dan netral dan ditemukan bahwa komposisi dari ketiga sentimen tersebut tidaklah seimbang (imbalanced dataset) dimana kelas positif memiliki lebih sedikit data dibanding kelaskelas lainnya. Untuk mengatasi masalah tersebut, digunakan metode resampling SMOTE agar jumlah data pada kelas positif dapat mengimbangi kelas lainnya. Model fastTextCNN-BiLSTM diukur performanya dengan melihat nilai akurasi, precision, recall, dan f1-score. Dari hasil penelitian didapat bahwa model gabungan CNN-BiLSTM memberikan nilai akurasi, precision, recall, dan f1-score yang paling baik dibanding model CNN dan BiLSTM saja. Model-model yang menggunakan word embedding fastText juga memberikan performa yang lebih baik dibanding model tanpa fastText (menggunakan word embedding standar). Secara keseluruhan, model gabungan fastTextCNN-BiLSTM ditemukan memiliki performa yang lebih baik dibandingkan dengan model-model lainnya.

Sentiment analysis is a computational study to analyze person’s opinion about an entity expressed in text. There are several machine learning models, especially deep learning models that can be used for sentiment analysis, such as Convolutional Neural Network (CNN) and Bidirectional Long Short-Term Memory (BiLSTM). Essentially, deep learning models cannot directly process textual data and they need a method to transform text into numerical tensors such as word embedding. In this research, a hybrid model CNN-BiLSTM with fastText word embedding is proposed for sentiment analysis. The model is trained using Indonesian tweets data regarding public opinions on the plan for subsidizing the purchase of electric vehicles in Indonesia. The data is classified into positive, negative, and neutral sentiments, and it is found that the composition of these sentiments is imbalanced, with the positive class having fewer data compared to the other classes. To address this issue, the SMOTE resampling method is used to balance the data in the positive class with the other classes. The performance of the fastText-CNNBiLSTM model is measured by accuracy, precision, recall, and f1-score. The research results show that the hybrid model CNN-BiLSTM achieves the highest accuracy, precision, recall, and f1-score compared to the single models CNN and BiLSTM. Models with fastText word embedding also outperform models without fastText (with standard word embedding). Overall, the hybrid model fastText-CNN-BiLSTM is found to outperform other models in terms of performance."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Emha Fathul Akmam
"Nilai yang hilang adalah suatu kondisi ketika ada beberapa entri yang hilang atau nilai kosong pada beberapa pengamatan dalam data. Ini dapat menyebabkan kita memiliki data yang tidak lengkap yang dapat menghambat proses analisis statistik dan dapat memberikan kesimpulan yang bias dari analisis jika tidak dapat ditangani dengan benar. Masalah ini juga dapat ditemukan dalam beberapa analisis regresi linier. Salah satu cara untuk mengatasi masalah ini adalah dengan menggunakan beberapa metode imputasi yang disebut Predictive Mean Matching (PMM). Beberapa imputasi adalah pendekatan umum untuk menangani data yang hilang yang memungkinkan ketidakpastian tentang data yang hilang dengan membuat serangkaian data imputasi yang masuk akal dan hasil analisis gabungan tepat yang diperoleh dari setiap data. Metode ini akan mencocokkan jarak rata-rata prediktif dari pengamatan tidak lengkap dengan pengamatan lengkap. Dengan demikian, pengamatan lengkap yang memiliki jarak terdekat akan menjadi nilai donor bagi yang tidak lengkap. Mean prediktif untuk pengamatan lengkap diperkirakan dengan kuadrat biasa yang paling tidak lengkap dan didekati oleh konsep Bayesian. Artikel ini akan menjelaskan tentang distribusi posterior yang memungkinkan ketidakpastian nilai yang hilang untuk memperkirakan parameter pengamatan yang tidak lengkap dan mendapatkan rata-rata prediktif mereka. Artikel ini akan memberikan hasil tentang penerapan metode PMM dalam data simulasi yang memiliki pola hilang univariat dengan mekanisme MAR dan dievaluasi dengan nilai bias dari koefisien regresi dari koefisien hasil pada dataset yang ditentukan.

Missing value is a condition when there are some missing entries or empty values ​​on some observations in the data. This can cause us to have incomplete data that can hinder the process of statistical analysis and can provide biased conclusions from the analysis if it cannot be handled properly. This problem can also be found in several linear regression analyzes. One way to overcome this problem is to use several imputation methods called Predictive Mean Matching (PMM). Some imputations are a general approach to handling missing data that allows uncertainty about missing data by making a series of reasonable imputation data and the precise combined analysis results obtained from each data. This method will match the predictive average distance from incomplete observations with complete observations. Thus, a complete observation that has the closest distance will be a donor value for the incomplete. The predictive means for complete observations are estimated with the most incomplete ordinary squares and are approached by the Bayesian concept. This article will explain posterior distributions that allow uncertainty of missing values ​​to estimate incomplete observation parameters and obtain their predictive averages. This article will provide results about the application of the PMM method in simulation data which have a univariate missing pattern with the MAR mechanism and are evaluated with a bias value of the regression coefficient of the yield coefficient on the specified dataset."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dian Rimarni
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2002
S27371
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dzikrina Laili Kusumadewi
"Anak-anak tidak dapat dihindarkan dari penggunaan berbagai macam teknologi yang telah berkembang saat ini. Atas penggunaan teknologi tersebut, maka disertai pula dengan ancaman penyalahgunaan data pribadi seseorang yang mungkin akan muncul setelahnya. Ancaman tersebut cukup meresahkan, terutama bagi anak-anak yang dalam pandangan hukum dianggap sebagai individu yang tidak cakap. Sayangnya, Undang-Undang Nomor 27 Tahun 2022 tentang Perlindungan Data Pribadi (UU PDP) tidak mengatur dan menjelaskan secara rinci perlindungan-perlindungan yang bisa anak dapatkan atas keamanan data pribadinya. Oleh karena itu, penelitian ini akan membahas tentang aturan anak, sanksi, dan ganti rugi dalam perlindungan data pribadi; ketentuan hak-hak anak; dan perbandingan implementasi. Tujuannya untuk memberikan penjelasan mengenai apa saja ketentuan yang telah diatur dan bagaimana pelaksanaannya di Indonesia, yang kemudian akan dibandingkan dengan ketentuan dalam General Data Protection Regulation (GDPR). Penelitian ini menggunakan metode yuridis-normatif, berdasarkan bahan kepustakaan hukum, dengan pendekatan komparatif atau perbandingan. Hasil yang di dapat adalah bahwa ketentuan untuk anak dalam UU PDP masih belum memadai untuk melindungi data pribadi anak secara tegas dan jelas, yang mana berbanding terbalik dengan ketentuan dalam GDPR. Akibatnya, tidak ada pengimplementasian yang signifikan dalam kehidupan sehari-hari. Dengan demikian, pemerintah perlu membentuk dan mengesahkan undang-undang baru yang terfokus membahas mengenai perlindungan data pribadi anak.

Childrens are inseparable from using various kinds of technology. The use of this technology also has a negative impact, which is misuse of one's personal data. This threat is quite troublesome, especially for children, in the eyes of the law, that are considered as incompetent individuals. Unfortunately, Regulation Number 27/2022 concerning Personal Data Protection (PDP Law) does not regulate and explain in detail the protections that children can get for the security of their personal data. Therefore, this research will discuss child regulations, sanctions, and compensation in protecting personal data; child rights provisions; and the comparison of implementation. The aim is to provide an explanation of what provisions have been regulated and how they are implemented in Indonesia, which will then be compared with the provisions in the General Data Protection Regulation (GDPR). This study uses a juridical-normative method, based on legal literature, with a comparative approach. The result obtained is that the provisions for children in the PDP Law are still inadequate to protect children's personal data explicitly and clearly, which is inversely proportional to the provisions in the GDPR. As a result, there is no significant implementation in everyday life. Thus, the government needs to form and pass a new law that focuses on discussing the protection of children's personal data."
Depok: Fakultas Hukum Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>