Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 105106 dokumen yang sesuai dengan query
cover
Rendya Yuschak
"Dalam era digital saat ini, banyaknya data finansial yang melimpah dan tidak berlabel menimbulkan tantangan dalam pemilihan teknik pendeteksian outlier (outlier detection) yang optimal. Penelitian ini bertujuan untuk menangani tantangan tersebut dengan membandingkan model unsupervised outlier detection pada data sintetis yang dirancang untuk meniru karakteristik data finansial nyata. Sebagai studi kasus, penelitian ini menggunakan data Laporan Harta Keuangan Penyelenggara Negara (LHKPN) tahun 2022. Proses penelitian mencakup pengumpulan data, pemrosesan, pembuatan data sintetis, pengujian sepuluh algoritma outlier detection, dan penerapan model terbaik pada data LHKPN tahun 2022. Dari proses ini, model Median Absolute Deviation (MAD) dengan threshold 7.8 teridentifikasi sebagai yang paling efektif pada data sintetis yang meniru data LHKPN. Penelitian ini juga menemukan hyperparameter terbaik untuk model lain dan melakukan analisis skor outlier pada data nyata. Hasilnya memberikan wawasan baru dan menunjukkan potensi investigasi lanjutan dalam outlier detection pada data finansial tidak berlabel, dengan pendekatan yang menyeluruh mulai dari analisis distribusi data hingga pengujian model pada data sintetis dan asli.

In the current digital era, the abundance of unlabeled financial data poses challenges in selecting optimal outlier detection techniques. This research aims to address these challenges by comparing unsupervised outlier detection models on synthetic data, designed to mimic real financial data characteristics. Using 2022 data from the Laporan Harta Keuangan Penyelenggara Negara (LHKPN) as a case study, the research process includes data collection, processing, creating synthetic data, testing 10 outlier detection algorithms, and applying the most effective model, identified as Median Absolute Deviation (MAD) with a threshold of 7.8, on synthetic data based on LHKPN data. The study also finds the best hyperparameters for other models and conducts real data outlier score analysis, providing new insights and demonstrating further investigation potential in outlier detection for unlabeled financial data."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rasendriya Maheswari
"Teknologi microarray merupakan alat terapan ilmu bioinformatika dalam bidang biologi molekuler yang dapat menghasilkan suatu data ekspresi gen. Namun, pada data ekspresi gen sering ditemukan missing value yang dapat mengganggu proses analisis data. Untuk mengatasi masalah tersebut, missing value dapat diestimasi menggunakan teknik imputasi. Penelitian ini menggunakan metode NCBI-SSSim-QR yang merupakan metode imputasi biclustering berbasis Shifting-and-Scaling Similarity (SSSim) dan menggunakan regresi kuantil dalam mengestimasi missing values. Metode ini merupakan modifikasi dari metode NCBI-SSSim-LS yang menggunakan regresileast square dalam proses imputasinya. Regresi kuantil pada metode NCBI-SSSim-QR digunakan untuk menangani keberadaan outlier pada data karena regresi kuantil dapat menyesuaikan kemiringan distribusi data pada titik-titik kuantil tertentu. Pada penelitian ini, metode NCBI-SSSim-QR diimplementasikan pada data ekspresi gen kanker serviks yang mengandung outlier dan diujikan pada missing rate 5%, 10%, 15%, 20%, 25%, 30%, dan 35% dengan mekanisme MCAR (Missing Completely at Random) dalam pembentukan missing values. Terdapat beberapa titik kuantil yang diuji yaitu kuantil ke = 0,3, 0,4, 0,5, 0,6, 0,7 yang kemudian performanya dibandingkan dengan metode NCBI-SSSim-LS yang berbasis mean. Penelitian menunjukkan bahwa proses estimasi missing values pada data ekspresi gen kanker serviks paling baik dilakukan oleh metode NCBI-SSSim-QR dengan kuantil 0,5 berdasarkan nilai Root Mean Square Error (RMSE).

Microarray technology is a bioinformatics tools in molecular biology that capable for quantitating hundreds or thousands of gene transcripts called gene expression data. However, the presence of missing values is often found in gene expression data which can interfere the further analysis process. Therefore, imputation technique used for estimating missing values. This research used NCBI-SSSim-QR method which is a Shifting-and-Scaling Similarity (SSSim)-based biclustering imputation method using quantile regression to estimate the missing values. This method is a modification of the NCBI-SSSim-LS method that using the least square regression for imputation process. Quantile regression in the NCBI-SSSim-QR method is used to handle the presence of outliers in the data because quantile regression can follow the skewness of the data distribution at certain quantile points. In this research, the NCBI-SSSim-QR method will be implemented on cervical cancer gene expression data containing outliers and tested on missing rate of 5%, 10%, 15%, 20%, 25%, 30%, and 35% with MCAR (Missing Completely at Random) mechanism in generating missing values. There are several quantile points to be tested, = 0,3, 0,4, 0,5, 0,6, 0,7 which will then be compared with the NCBI-SSSim-LS method which is mean-based. The research shows that the estimation process for missing values in cervical cancer gene expression data is better estimated by NCBI-SSSim-QR method with a quantile of 0,5 based on the Root Mean Square Error (RMSE) value."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Habibie
"Sistem sensor kapasitif pengidentifikasi bahan dengan dua elektroda merupakan sensor yang berfungsi untuk mendeteksi bentuk karakteristik suatu bahan dalam hal ini adalah dari kasus beberapa jenis tanah. Jenis Bahan uji tanah pada skripsi ini meliputi tanah (tambang) Lampung, tanah Medan, tanah DTE, dan tanah Bogor. Pada pengkajian kali ini dilihat karakteristik setiap bahan uji tanah dengan memanfaatkan efek impedansi terhadap perubahan frekuensi dalam rentang spektralnya. Sistem sensor ini memanfaatkan pengaruh perubahan impedansi yang terjadi pada elektroda sensor. Impedansi akan berubah jika material dielektrik dengan konduktivitas diantara dual plat berubah. Sistem identifikasi ini juga memanfaatkan spektral noise dari sinyal keluarannya, dengan sinyal yang diberikan berbentuk pulse dalam rentang frekuensi sinyal 1,3,5,7,10,30,50,70,100,300,500,700 KHz dan 1,3,5,7,10 MHz. Pengujian dilakukan dengan mengolah data dari sekali pengukuran yang menghasilkan 1000 paket data dengan banyaknya data per paket 16384 (214) dalam interval 4[ns] per sampling datanya. Data dari hasil pengukuran, diolah dengan cara statistik. yang meliputi : Rata-rata, Standar deviasi dan Reciprocal dari standar deviasi. Pegambilan data dilakukan dengan DSO picoscope, dan pengolahannya menggunakan perangkat lunak Matlab. Hasil dari analisis konsistensi bahan uji berbeda-beda. Untuk analisis perbandingan sudah terlihat perbedaan karakteristik setiap jenis tanah melalui grafiknya.

Capacitive sensor system to identify material with two electrode are sensor whoch have function to detect characteristic kind of soil material. Identification of soil material include : soil of Lampung, soil of Medan, soil of DTE, and soil of Bogor. On this analysis is looking for characteristic each of soil material utilizing impedance effect toward changing of spectral frequency. The sensor is utilizing effect of impedance changing which occurs in the sensor electrode. Impedance will be change, if the dielectric of material with conductivity between two plate is change. the identification of sensoris also using spectral noise from outut sinal. Waveform signal application is pulse with frequency signal is 1.3.5.7.10,30,50,70,100,300,500,700 KHz and 1,3,5,7,10 MHz. The tested of material carried out of recording 1000 data set on each capture which has produce 16384/set with interval is 4ns/ data sampling. Processing and analyze data using different from each material. For comparative analysis has shown differences in the characteristics of each type soil through the graph.
"
Depok: Fakultas Teknik Universitas Indonesia, 2013
S46405
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nurul Annisa
"Dalam upaya meminimalisir penyebaran virus COVID-19, pemerintah di berbagai negara memberlakukan berbagai kebijakan untuk membatasi mobilitas masyarakat yang berdampak pada berbagai aspek, salah satunya aspek psikologis. Banyak orang yang merasa kesepian, gelisah, dan tertekan karena situasi sulit dan tidak pasti akibat pandemi COVID-19 sehingga mengakibatkan terganggunya kesejahteraan mental dan meningkatnya tingkat stres masyarakat. Penelitian ini bertujuan untuk mengidentifikasi faktor-faktor yang dapat menjelaskan tingkat stres masyarakat selama pandemi COVID- 19. Data yang digunakan pada penelitian ini merupakan data survei terkait dampak psikologis dan sosial yang ditimbulkan akibat kondisi pandemi COVID-19 pada masyarakat dari berbagai negara di dunia yang diperoleh dari survei global COVIDiSTRESS. Survei ini diselenggarakan mulai dari 30 Maret hingga 30 Mei 2020 dengan total responden sebanyak 173.426 responden dari 179 negara yang berbeda. Data yang digunakan memiliki permasalahan missing value yang ditangani secara khusus dengan menggunakan metode imputasi Predictive Mean Matching (PMM). Setelah seluruh missing value pada data berhasil ditangani, dilakukan analisis faktor- faktor yang menjelaskan tingkat stres selama pandemi COVID-19 menggunakan metode Partial Least Square (PLS). Dari penelitian ini, diperoleh bahwa metode imputasi PMM memiliki performa yang baik dalam menangani permasalahan missing value pada data survei global COVIDiSTRESS yang selanjutnya dianalisis dengan model PLS. Selain itu, berdasarkan hasil nilai signifikansi path coefficient dari model diperoleh bahwa seluruh variabel prediktor yang terlibat dalam penelitian ini merupakan faktor yang signifikan dalam menjelaskan tingkat stres masyarakat dari berbagai negara di dunia selama menghadapi pandemi COVID-19. Melalui nilai path coefficient dari model, arah hubungan yang terbentuk antara tingkat stres masyarakat selama pandemi COVID-19 dengan faktor-faktor yang dapat menjelaskannya juga teridentifikasi pada penelitian ini.

In an effort to minimize the spread of COVID-19 virus, governments in various countries have implemented various policies to restrict public mobility which has had an impact on various aspects, including psychological well-being. Many people feel lonely, anxious, and depressed because of the difficult and uncertain situation due to the COVID-19 pandemic, which has disrupted mental well-being and increased stress levels in society. This study aims to identify factors that can explain the level of stress in society during the COVID-19 pandemic. The data used in this study is survey data related to the psychological and social impacts caused by the COVID-19 pandemic conditions on people from various countries in the world obtained from the COVIDiSTRESS global survey. This survey was conducted from 30 March to 30 May 2020 with a total of 173.426 respondents from 179 different countries. The data used has a missing value problem which is handled specifically by using the Predictive Mean Matching (PMM) imputation method. After all the missing values in the data have been successfully handled, analysis of factors that explain the stress level during the COVID- 19 pandemic is carried out using the Partial Least Square (PLS) method. From this study, it was found that the PMM imputation method had good performance in dealing with missing value problem in the COVIDiSTRESS global survey data which was then analyzed using the PLS model. Furthermore, based on the significance values of the path coefficients obtained from the model, it was found that all predictor variables involved in this study were significant factors in explaining the level of stress in society from various countries worldwide during the COVID-19 pandemic. Through the path coefficients of the model, the direction of the relationships formed between the level of stress in society and the factors that can explain it were also identified in this research."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rimbun Budiman
"Data Panel merupakan kombinasi dua jenis data yaitu data cross section dan data time series. Tujuan dari penulisan tugas akhir ini adalah mencari taksiran parameter pada model regresi untuk data panel yang tidak lengkap (incomplete panel data regression models) dengan komponen error satu arah (one-way error component). Selain itu model regresi tersebut merupakan random effect models, yang berarti perbedaan karakteristik individu dan waktu diakomodasikan pada komponen error dari model.
Metode yang digunakan untuk menaksir parameter adalah metode Feasible Generalized Least Squares (FGLS). Pada metode tersebut, matriks kovarians error tidak diketahui, sehingga perlu dilakukan penaksiran terhadap komponen variansi yang terdapat pada matriks kovarians error tersebut. Metode yang digunakan untuk menaksir komponen variansi adalah modifikasi metode penaksiran ANOVA yang diusulkan oleh Wallace dan Hussain."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ahmad Haulian Yoga Pratama
"Penerapan teknik Explainable AI (XAI) telah menjadi fokus utama penelitian dalam upaya untuk meningkatkan interpretabilitas dan kepercayaan dalam model AI, khususnya pada bidang outlier detection. Penelitian ini bertujuan untuk mengungkapkan proses pengambilan keputusan yang kompleks di balik proses outlier detection, serta untuk memberikan pemahaman yang lebih dalam tentang faktor-faktor yang mempengaruhi keputusan tersebut. Dalam penelitian ini, diselidiki berbagai teknik XAI yang dapat digunakan dalam konteks outlier detection. Penelitian ini memberikan evaluasi komprehensif tentang aplikasi XAI dalam outlier detection, dengan mengevaluasi kelebihan dan kelemahan dari setiap teknik yang digunakan. Hasil eksperimen menunjukkan bahwa penerapan XAI dalam outlier detection dapat memberikan wawasan yang berharga tentang faktor-faktor yang mempengaruhi keputusan model, dan dapat meningkatkan interpretabilitas dan kepercayaan dalam model outlier detection.

The application of Explainable AI (XAI) techniques has been the main focus of research to improve interpretability and trust in AI models, particularly in the field of outlier detection. This study aims to uncover the complex decision-making process behind outlier detection and provide a deeper understanding of the factors influencing these decisions. Various XAI techniques that can be used in outlier detection are investigated in this research. This study provides a comprehensive evaluation of XAI applications in outlier detection by assessing the strengths and weaknesses of each technique used. The experimental results indicate that the implementation of XAI in outlier detection can provide valuable insights into the factors influencing model decisions and can enhance the interpretability and trustworthiness of outlier detection models."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
M. Sabeth Abilawa
"Salah satu prasyarat keberhasilan program-program pembangunan sangat tergantung pada ketepatan pengidentifikasian target group dan target area. Begitu pula dalam program pengentasan kemiskinan, keberhasilannya tergantung pada langkah awal dari formulasi kebijakan, yaitu mengidentifikasi siapa sebenarnya ?si miskin? tersebut dan dimana dia berada? Kedua pertanyaan tersebut setidaknya dapat dijawab dengan melihat profil kemiskinan Profil kemiskinan dapat dilihat setidaknya dari karakteristik perumahan dan fasilitasnya, karakteristik demografi, kependidikan, ketenagakerjaan, akses informasi, kepemilikan asset, kesehatan, sosial. dan lain-lain.
Penelitian ini ini untuk mengetahui karakteistik rumah tangga miskin khususnya di Provinsi Nanggroe Aceh Darussalam berdasarkan data Susenas 2007 dengan menggunakan 2 metode yaitu Stepwise Discriminant Analysis dan Binnari Logistic Regression serta untuk memperkuat hasil uji dilakukan analisa uji grouping test dan chi square terhadap variabel-variabel yang terpilih. Dengan estimasi yang dihasilkan maka dapat diperbandingkan antara kemiskinan secara konseptual, mengacu pada SKPM BPS 2000 dengan model yang dibentuk sehingga bisa diperkirakan berapa misklasifikasi yang terjadi.
One prerequisite for the success of development programs is highly dependent on the accuracy of identifying target groups and target areas. Similarly, the poverty alleviation program, its success depends on the initial steps of the formulation of policy, namely to identify who exactly "the poor" and where he/she is? Both these questions can be answered with at least see the profile of poverty. Poverty profile can be seen at least from the housing characteristics and facilities, demographic characteristics, education, employment, access to information, asset ownership, health, social. and others.
This study was to determine characteristics poor households, especially in the province of Nanggroe Aceh Darussalam and used Susenas 2007 data. Study also use two methods in statistics Stepwise Discriminant Analysis and Binnary Logistic Regression, and to strengthen the results of tests conducted by analysis of grouping tests and chi square test of selected variables. With the resulting estimates can then be compared between poverty in concept, referring to the SKPM BPS was formed in 2000 with the model that can be estimated how many misclassification happened.
"
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2010
T27735
UI - Tesis Open  Universitas Indonesia Library
cover
Yoel Fernando
"Penelitian biologi dengan menggunakan teknologi microarray menghasilkan data ekspresi gen berbentuk matriks di mana baris adalah gen dan kolom adalah kondisi. Analisis lanjutan dalam data ekspresi gen membutuhkan data yang lengkap. Namun, data ekspresi gen sering kali mengandung nilai hilang atau missing values. Ada berbagai cara untuk mengatasi missing values, antara lain pembuangan gen atau kondisi yang mengandung missing values, pengulangan pengambilan data, dan imputasi missing values pada data ekspresi gen. Pendekatan imputasi missing values awal hanyalah dengan mengisi nilai nol atau rata-rata baris. Namun, pendekatan ini tidak melihat informasi koheren dalam data. Pendekatan imputasi missing values terbagi menjadi empat berdasarkan informasi yang diperlukan pada algoritmanya, yaitu pendekatan lokal, pendekatan global, pendekatan hybrid, dan pendekatan knowledge assisted. Pada penelitian ini peneliti menggunakan algoritma pendekatan lokal dan global. Metode imputasi missing values paling popular untuk pendekatan global adalah Bayesian Principal Component Analysis (BPCA), sedangkan untuk pendekatan lokal adalah Local Least Square (LLS). Pada metode LLS, pemilihan similaritas gen dilakukan dengan teknik clustering dimana seluruh kondisi dalam data digunakan. Kenyataanya, terkadang gen-gen similar hanya dalam beberapa kondisi eksperimental saja. Maka, diperlukan teknik biclustering untuk dapat menemukan subset gen dan subset kondisi yang similar sebagai informasi lokal. Penerapan ide biclustering dalam LLS dinamakan sebagai Iterative Bicluster-Based Least Square (bi-iLS). Salah satu tahapan awal dalam bi-iLS adalah pembentukan matriks komplit sementara yang didapat dengan cara mengisi missing values dengan row average. Namun, row average dinilai kurang bagus karena hanya menggunakan informasi satu baris tersebut. Kekurangan ini diperbaiki dalam penelitian ini. Penggunaan metode BPCA untuk menemukan matriks komplit sementara dinilai lebih baik karena BPCA menggambarkan struktur keseluruhan data. Penggantian row average menjadi BPCA menjadi dasar masalah penelitian ini. Metode iterative Bicluster-based Bayesian Principal Component Analysis dan Least Square (bi-BPCA- iLS) pun diajukan. Penerapan bi-BPCA-iLS terhadap data ekspresi gen yang dihasilkan teknologi microarray terbukti menghasilkan penurunan nilai Normalzied Root Mean Square Error (NRMSE) sebesar 10,6% dan 0,58% secara rata-rata dalam beberapa missing rate (1%, 5%, 10%, 15%, 20%, 25%, dan 30%) jika dibandingkan dengan metode LLS dan bi-iLS.

Biological research using microarray technique produce some important gene expression datasets. These data can be expressed as a matrix in which rows are genes and columns are different conditions. Further analysis of these datasets requires a complete dataset or matrix. However, gene expression datasets often contain missing values. There are some ways to handle missing values, such as deletion of genes or conditions that contain missing values, repeat the process of acquiring data, and impute the missing values. Early approaches in missing values imputation are simply to replace missing values with zeros or row averages, but these methods do not use the coherence inside the data. Later, approaches in missing values imputations are categorized into four groups based on the required information, such as local, global, hybrid, and knowledge assisted approaches. In this paper, local and global approaches are used. Bayesian Principal Component Analysis (BPCA) is a well-known global based method, while the most popular local based method is Local Least Square (LLS). In LLS, selection of similar genes uses clustering technique where all conditions in the data are included. The reality is genes sometimes only correlate under some experimental conditions only. So, a technique that can find subset of genes under subset of experimental conditions for local information is needed. This technique is called biclustering. The usage of biclustering in LLS is called the Iterative Bicluster-based Least Square (bi-iLS). One of the early steps in bi-iLS is to find a temporary complete matrix. Temporary complete matrix is obtained by applying row averages to impute missing values. However, row average cannot reflect the real structure of the dataset because row average only uses the information of an individual row. The missing values in a target gene do not only rely on the known values of its own row. In this research, row average in bi-iLS is replaced with BPCA. The benefit of using BPCA is that it uses global structure of the dataset. This update will be the basic problem of this research. The proposed method is called Iterative Bicluster-based Bayesian Principal Component Analysis and Least Square (bi-BPCA-iLS). This new proposed method is applied to gene expression datasets from microarray technique. It shown a decrease in values of Normalized Root Mean Square Error (NRMSE) about 10.6% from LLS and about 0.58% from bi-iLS based on different missing rates (1%, 5%, 10%, 15%, 20%, 25%, and 30%)."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Melati Ayuwangi
"Runtun waktu merupakan barisan data yang diukur pada interval waktu yang periodik. Pada pengambilan data runtun waktu seringkali ditemukan adanya outlier, yang dapat mempengaruhi taksiran parameter autoregressive dan peramalan data. Pada skripsi ini diperkenalkan teknik baru untuk mendeteksi outlier pada model autoregressive dan mengidentifikasi jenis outlier sebagai additive atau innovation. Teknik ini diperkenalkan oleh Allan McQuarrie dan Chih L. Tsay, dan dapat digunakan tanpa diketahuinya model order sebenarnya, waktu terjadinya outlier, dan jenis outlier. Pertama, akan dicari taksiran besaran outlier yang meminimumkan residual sum of square (SSE). Kemudian dari taksiran tersebut akan didapatkan pengurangan terhadap SSE yang nantinya akan digunakan untuk mendapatkan besaran pendeteksian outlier dan juga digunakan untuk mengidentifikasi jenis outlier. Akan dicari pula penaksir yang robust untuk standar deviasi."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2010
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Stanislaus S. Uyanto
Yogyakarta: Graha Ilmu, 2006
310 STA p
Buku Teks  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>