Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 85520 dokumen yang sesuai dengan query
cover
Azizah Awaliah
"Regresi Poisson sering digunakan untuk menganalisis data diskrit count data. Regresi ini memiliki asumsi equidispersi. Namun, dalam banyak kasus sering dijumpai asumsi tersebut tidak terpenuhi karena adanya overdispersi pada data. Salah satu penyebab overdispersi adalah excess zero. Model regresi yang dapat digunakan untuk mengatasi masalah tersebut adalah regresi Zero-Inflated Poisson ZIP . Regresi ZIP menyelesaikan masalah excess zero dengan mengidentifikasi structural zeros di tahap pertama dan model Poisson counts di tahap kedua. Pada penelitian ini, parameter regresi ditaksir menggunakan metode Bayesian. Pada metode Bayesian, unsur ketidakpastian parameter dipertimbangkan model dalam bentuk distribusi prior. Dengan mengombinasikan distribusi prior dan likelihood, diperoleh distribusi posterior dari parameter yang menjadi perhatian dalam penelitian. Teknik komputasional Markov Chain Monte Carlo-Gibbs Sampling MCMC-GS digunakan untuk melakukan sampling nilai-nilai parameter dari distribusi posterior tersebut. Metode ini kemudian diterapkan untuk memodelkan frekuensi komplikasi motorik pada 215 penderita penyakit Parkinson. Diperoleh hasil bahwa total skor MDS-UPDRS Part 2 dan 3 berasosiasi dengan konsumsi atau tidaknya obat-obatan pada pasien. Lebih lanjut, untuk mereka yang mengonsumsi obat, total skor MDS-UPDRS Part 1 berasosiasi dengan frekuensi komplikasi motorik.

Poisson regression is commonly used for analizing count data. This method requires equidispersion assumption. However, in the case of overdispersion, this assumption is not always fulfilled. Overdispersion may exist when there is excess zeros in the data. One of the regression models which might solve it is Zero Inflated Poisson ZIP regression. ZIP regression solves the excess zero problem by identifying the structural zeros at the first stage, then Poisson counts model at the second stage. In this research, the regression parameters are estimated using Bayesian method. Bayesian method acomodates the uncertainty parameters through prior distribution. Combining the prior distribution and likelihood from the data results in the posterior distribution of the parameters of interest. True parameters are then sampled using Markov Chain Monte Carlo Gibbs Sampling MCMC GS. Therefore, this method is applied to model the frequency of motor complications in 215 Parkinson 39 s disease patients. The result shows that total score of MDS UPDRS Part 2 and 3 associated with those taking the medicines or not. Furthermore, for those taking the medicines, total score of MDS UPDRS Part 1 associated with motor complications frequency."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Shafira
"Model regresiZero Inflated Poisson (ZIP) digunakan untuk memodelkan count data dengan overdispersi yang disebabkan oleh nilai nol yang berlebih pada pengamatannya(excess zero). Namun, ketika overdispersi berasal dariexcess zerodan datacount, makaZIP tidak lagi cocok. Model regresi Zero Inflated Negative Binomial (ZINB) bertujuan untuk mengetahui variabel apa saja yang berpengaruh secara signifikan terhadap variabelrespon. Data untuk regresi ZINB ini memiliki dua sumber overdispersi. Terdapat dua proses pada variabel respon, yang mendasari pengamatan masuk ke dalam structural zeros atau Negative Binomial (NB) counts. Jadi, regresi ZINB terdiri dari dua model. Pada kedua model tersebut dilakukan penaksiran parameter menggunakan metode Bayesian. Metode ini menganggap parameter-parameter yang digunakan merupakan variabel acakyang memiliki distribusi sebagai informasi prior, dan mengkombinasikannya dengan data yang dimiliki. Kombinasi tersebut selanjutnya disebut sebagai distribusi posterior. Sampling parameter dari distribusi posterior dilakukan dengan simulasi Markov Chain Monte Carlo (MCMC). Sebagai penerapan, digunakan data Parkinson dari Parkinsons Progression Markers Initiative (PPMI). Variabel responnya yaitu frekuensi seberapa sering pasien mengalami komplikasi setelah meminum obat atau tidak, dan variabel prediktornya berupa skor pemeriksaan aspek motorik, non-motorik, dan respon-respon tubuh. Diperoleh hasil bahwa model ZINB cocok untuk memodelkan data tersebut yangditandai dengan hasil simulasi yang konvergen.

Zero Inflated Poisson (ZIP) regression model is a standard framework for modeling discrete data with over-dispersion caused by excess zero. When over-dispersion has comefrom excess zero and count data, ZIP is no longer matches. A Zero Inflated Negative Binomial (ZINB) regression model aims to analyze the variables affecting data with two sources of over-dispersion. Hence there are two processes at the response variable, which make an observation classified as structural zeros or Negative Binomial (NB) counts. So, ZINB regression consists oftwo models. This paper will use Bayesian method forestimating parameter in both models. The Bayesian method considers parameters to bea random variable that has distribution known as prior distribution, and combine with information of the data. This combination referred as posterior distribution. Sampling parameter from posterior distribution is done using Markov Chain Monte Carlo (MCMC) simulation. As an application, the Parkinsons data is used from Parkinsons Progression Markers Initiative (PPMI). Frequency of how often the patient has complications aftertaking the drug or not is the response, and the predictive variables are motoric aspect, non-motoric aspect, and body responses test scores. The simulation result shows that it isconvergent, indicate that ZINB model is suitable for modeling Parkinsons data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ivana Ratanaputri
"Data biner merupakan tipe data yang memiliki tepat dua kemungkinan nilai, seperti sukses dan gagal atau ya dan tidak, yang lebih lanjut direpresentasikan dalam respon 0 dan 1. Data biner kerap dijumpai dalam kehidupan sehari-hari. Namun, tidak jarang pula ditemukan data biner yang mengalami zero-inflation. Fenomena zero-inflation ini merujuk kepada data dengan dua sumber nilai nol yang berbeda, yang dikenal dengan istilah structural zeros dan sampling zeros. Oleh karena itu, dikembangkanlah suatu model alternatif, yakni model regresi Zero-Inflated Bernoulli untuk memodelkan data biner yang mengalami zero-inflation. Dalam inferensi statistika, terdapat dua jenis pendekatan yang umumnya digunakan, yaitu pendekatan frekuentis dan pendekatan Bayesian. Pada tugas akhir ini, dikonstruksi suatu model regresi Zero-Inflated Bernoulli menggunakan pendekatan Bayesian. Pendekatan Bayesian digunakan karena dianggap lebih unggul dibandingkan pendekatan frekuentis. Dalam data yang mengalami zero inflation, pendekatan frekuentis tidak mampu membedakan structural zeros dan sampling zeros. Hasil konstruksi model yang terbentuk diberi nama model regresi Bayesian Zero-Inflated Bernoulli. Salah satu hal penting dalam pendekatan Bayesian adalah mendapatkan distribusi posterior. Namun, sering kali nilai parameter dari distribusi posterior sulit ditemukan secara analitik karena distribusi posteriornya memiliki formula terbuka. Oleh karena itu, dalam tugas akhir ini estimasi parameter sekaligus pembangunan sampel posterior dicari melalui teknik komputasional dengan algoritma No-U-Turn Sampler (NUTS). Selanjutnya, model regresi Bayesian Zero-Inflated Bernoulli diimplementasikan untuk masalah klasifikasi pada data sickness presenteeism. Dalam tugas akhir ini, dibangun dua buah model regresi Bayesian Zero-Inflated Bernoulli, yakni model tanpa kovariat dan model dengan kovariat. Dari model tanpa kovariat, diperoleh estimasi parameter distribusi variabel respon adalah p1 = 0.38 dan p2 = 0.75. Lebih lanjut, hasil estimasi probabilitas yang diperoleh mendekati nilai empirisnya. Pada model dengan kovariat, digunakan dua kovariat untuk dua bagian yang berbeda, yakni evaluasi kondisi kesehatan (gh) pada seluruh sampel dan kovariat frekuensi merasakan perasaan takut tergantikan apabila tidak masuk kerja (remplz) pada sampel at-risk, hasil estimasi parameter regresi akan menghasilkan persamaan regresi yang dapat digunakan memberikan prediksi klasifikasi variabel respon kondisi pekerja yang masuk kerja pada saat sedang sakit. Diperoleh, berturut-turut tingkat akurasi dari model dengan kovariat gh dan kovariat remplz adalah sebesar 72.44% dan 69.58%, tingkat sensitivitas sebesar 14.65 % dan 100.00%, serta tingkat specificity sebesar 94.35% dan 0.00%.

Binary data is type of data that have exact two outcomes, for instance, success and failure or yes and no, that usually represent in 0 and 1. Binary data can be easily find on daily basis. However, there is binary data that experienced with zero-inflation. Zero-inflation phenomenon is caused by two different sources of zeros, which is called structural zeros and sampling zeros. Therefore, Zero-Inflated Bernoulli regression model is constructed for modeling binary data that experienced zero-inflation. There are two statistical inferences that is commonly used, that is frequentist and Bayesian inference. This thesis constructed Zero-Inflated Bernoulli regression model with Bayesian inference. Bayesian inference is selected because it is more superior than frequentist inference on modeling binary data with two different source of zeros. Frequentist inference unable to distinguish the difference between structural zeros and sampling zeros. Constructed model is called Bayesian Zero-Inflated Bernoulli regression model. In Bayesian inference, it is important to get the predicted posterior distribution. However, in some cases, the analytic estimation of the posterior distribution is difficult to calculate because it has open formula. Therefore, posterior estimator is searched using computational techniques name No-U-Turn Sampler algorithm (NUTS). Furthermore, this regression model is implemented on classification problem sickness presenteeism data. In this thesis, we constructed two models, that is model without covariates dan model with covariates. From model without covariates, the parameter from response variable distribution can be estimated and we got ‘p1 = 0.38 dan p2 = 0.75. This results is closed to the empirical value. Then, from model with covariates, two covariates is considered on implementation for different parts, i.e. general state of health (gh) covariate for all sample and feeling for being replaced (remplz) covariate for at-risk sample. From the estimated regression parameters, the regression equation is able give classification predictions for attend work while sick as response variable (sp recod). The results are the model give 72.44% and 69.58% accuracy rate."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
"Latar belakang: Indonesia merupakan salah satu negara tropis yang menjadi kawasan endemik penyakit tropis, salah satunya adalah penyakit filariasis (kaki gajah). Penyakit filariasis disebabkan oleh infeksi cacing filaria yang ditularkan oleh gigitan nyamuk. Data Riset Kesehatan Dasar (Riskesdas) 2007 menunjukkan bahwa persentase penderita filariasis di Provinsi Nangroe Aceh Darussalam (NAD) berada pada urutan pertama terbesar di Indonesia (6,4‰). Metode: Analisis
data sekunder yang berasal dari data Riskesdas tahun 2007. Unit analisis adalah individu yang tersampel di Provinsi NAD. Fokus riset pada hubungan antara penderita filariasis di Provinsi NAD dengan faktor yang mempengaruhinya. Metode yang digunakan adalah Regresi Poisson dan Zero Inlated Poisson (ZIP). Hasil: Peluang dari 10.000 RT yang dapat terkena penyakit filariasis adalah sebanyak 72 rumah tangga dan peluang dari 10.000 penduduk di provinsi NAD yang dapat terkena penyakit filariasis adalah sebanyak 25 penduduk. Individu yang tidur tidak menggunakan kelambu berisiko 1,60 terkena
filariasis dibandingkan yang tidur menggunakan kelambu. Sedangkan individu yang rumahnya tidak terdapat saluran limbah berisiko 3,47 menderita filariasis daripada yang memiliki saluran limbah. Kesimpulan: Variabel berpengaruh pada kejadian filariasis di NAD yaitu rata-rata jarak ke pelayanan kesehatan terdekat, rata-rata jarak ke sumber air dan persentase rumah tangga yang menggunakan kelambu berinsektisida saat tidur malam. Makin jauh jarak ke pelayanan dan jarak sumber air,
akan meningkatkan kejadian filariasis. Sedangkan makin banyak yang menggunakan kelambu berinsektisida saat tidur malam, akan menurunkan kejadian filariasis. Saran: Perlu analisis lanjut model pemetaan (spasial) pelayanan kesehatan. Kabupaten yang perlu mendapat perhatian adalah, Aceh Timur, Aceh Utara, Nagan Raya dan Aceh Besar."
613 BULHSR 17:1 (2014)
Artikel Jurnal  Universitas Indonesia Library
cover
Yudistira
"Dalam penerapan statistika di masyarakat, metode pengambilan sampel dilakukan untuk mendapatkan informasi tentang populasi yang menjadi fokus pengamatan. Namun karena keterbatasan dalam menjalankan metode pengambilan sampel, banyaknya sampel tersebut seringkali tidak mencukupi untuk mendapatkan taksiran yang presisi untuk populasi. Oleh karena itu, dikembangkan beberapa metode alternatif untuk menaksir parameter tersebut dengan area sampel yang jumlahnya kecil yang dibahas dalam topik Small Area Estimation. Dalam skripsi ini, dijelaskan tentang bagaimana mencari taksiran titik dari rata-rata populasi pada Small Area dengan metode Empirical Bayes berdasarkan model tingkat area. Secara umum, metode ini diawali dengan pendefinisian Model Spasial Tingkat Area, yaitu model dasar tingkat area dengan tambahan definisi model efek acak spasial pada . Model tersebut selanjutnya menjadi dasar untuk menaksir parameter rata-rata populasi dengan menggunakan Metode Empirical Bayes. Pada bagian akhir skripsi ini juga diberikan contoh penerapan metode Spatial Empirical Bayes untuk menaksir tingkat kemiskinan di Kota Depok pada tahun 2012.

In the application of statistics in society, sampling methods are conducted to obtain information about the populations that become a focus of observation. However, due to limitations in carrying out of sampling methods, the number of samples is often not sufficient to obtain precise estimates for the population. Therefore, several alternative methods are developed for estimating the parameters with a small number of sample areas which has covered in the topics Small Area Estimation. This paper is described about how to find a point estimation of population mean on small area with Empirical Bayes method based on area level model. In general, this method starts with defining the Spatial Area Level Model, which is the basic area level model with an additional definition of spatial random effects model for . That model then becomes basis for estimate parameter of population mean using Empirical Bayes methods. At the end, this paper also give an example of the application of Spatial Empirical Bayes methods for estimating poverty in Depok in 2012.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2014
S56956
UI - Skripsi Membership  Universitas Indonesia Library
cover
Setia Gunawan Wijaya
"Scan statistic merupakan suatu analisis untuk mendeteksi daerah yang merupakan kejadian luar biasa atau KLB (outbreak). Salah satu metode yang mendasari analisis scan statistic adalah metode Bayesian Scan Statistic. Metode ini menerapkan prinsip teorema bayesian, yaitu memanfaatkan informasi prior untuk menghasilkan informasi posterior yang dapat memperbaiki informasi prior. Metode Bayesian Scan Statistic memilih keadaan atau kondisi yang memiliki posterior probability yang terbesar sebagai daerah KLB-nya. Fungsi marginal likelihood dan prior probability merupakan dua komponen penting yang digunakan dalam metode ini untuk menghitung posterior probability untuk tiap-tiap daerah. Fungsi marginal likelihood didapat dari data historis dan modelnya merupakan gabungan antara distribusi poisson dan distribusi gamma. Sedangan untuk prior probability juga didapat dari data historis atau berdasarkan pada pengalaman seseorang. Metode bayesian scan statistic ini dapat digunakan jika terdapat data masa lalu. Kata kunci : bayesian scan statistic, bayesian cluster detection, prior probability, posterior probability. x + 54 hlm. ; gamb. ; lamp. ; tab. Bibliografi : 9 (1986-2006)"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2007
S27733
UI - Skripsi Membership  Universitas Indonesia Library
cover
Siti Salma Hasanah
"ABSTRACT
Model hurdle adalah model alternatif untuk mengatasi penyebaran berlebihan (varians datanya adalah lebih tinggi dari nilai rata-rata) yang disebabkan oleh kelebihan nol. Model rintangan dapat memodelkan secara terpisah variabel respons yang memiliki nilai nol dan positif, melibatkan dua proses yang berbeda. Proses pertama adalah proses biner yang menentukan apakah variabel respon memiliki nilai nol atau nilai positif, dan dapat dimodelkan dengan biner model, menggunakan regresi logistik. Untuk variabel respons positif, kemudian lanjutkan ke proses kedua, yaitu proses yang hanya mengamati jumlah positif. Yang positif count dapat dimodelkan dengan model Zero-Truncated menggunakan regresi Poisson. Rintangan model juga dikenal sebagai model dua bagian. Estimasi parameter menggunakan Bayesian metode. Kombinasi informasi sebelumnya dengan informasi dari data yang diamati membentuk distribusi posterior yang digunakan untuk memperkirakan parameter. Distribusi posterior bentuk yang diperoleh tidak tertutup, sehingga diperlukan teknik komputasi, yaitu Markov Chain Monte Carlo (MCMC) dengan algoritma Gibbs Sampling. Metode ini diterapkan
ke data Parkinson untuk memodelkan frekuensi komplikasi motorik pada 300 Parkinsonpasien. Data tersebut digunakan dari Parkinson's Progressive Markers Initiative (PPMI, 2018). Hasil yang diperoleh adalah MDS-UPDRS (Movement Disorder Society-Unified Skala Peringkat Penyakit Parkinson) bagian 1, MDS-UPDRS bagian 2, dan MDS-UPDRS bagian 3 terkait secara signifikan MDS-UPDRS bagian 4 di kedua tahap.

ABSTRACT
The obstacle model is an alternative model for overcoming excessive spread (the data variant is higher than the average value) which is questioned by zero excess. The obstacle model can separately model response variables that have zero and positive values, involving two different processes. The first process is a binary process that determines whether the response variable has a zero value or a positive value, and can be modeled with a binary model, using logistic regression. For positive response variables, then proceed to the second process, which is a process that is only positive. The positive one calculated can be modeled with a Zero-Truncated model using Poisson regression. The Obstacle Model is also known as the two part model. Parameter estimation using the Bayesian method. The combination of previous information with information from data collected collects the distributions used for parameter estimation. The posterior distribution of the obtained form is not closed, computational techniques are needed, namely Markov Chain Monte Carlo (MCMC) with Gibbs Sampling algorithm. This method is applied to Parkinson's data to model the frequency of motor complications in 300 Parkinson's patients. The data is used from Parkinson's Progressive Markers Initiative (PPMI, 2018). The results obtained are MDS-UPDRS (Movement Disorder-Community Parkinson's Disease Assessment Scale) part 1, MDS-UPDRS part 2, and MDS-UPDRS part 3 which significantly related MDS-UPDRS part 4 in both glasses.
"
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Lindley, D.V.
"A study of those statistical ideas that use a probability distribution over parameter space. The first part describes the axiomatic basis in the concept of coherence and the implications of this for sampling theory statistics. The second part discusses the use of Bayesian ideas in many branches of statistics."
Philadelphia: Society for Industrial and Applied Mathematics, 1995
e20451236
eBooks  Universitas Indonesia Library
cover
Farah Amalia
"Indonesia merupakan negara di dunia yang memiliki aktivitas seisimik yang tinggi. Jawa barat merupakan salah satu provinsi di Indonesia yang rawan terjadi gempa, karena di daerah Jawa Barat terdapat zona subduksi dan sesar geser. Kemunculan gempa berkekuatan besar dapat menyebabkan kerusakan dan menelan banyak korban jiwa. Oleh karena itu, ingin diketahui berapa probabilitas terjadinya gempa bumi berkekuatan besar di daerah Jawa Barat. Hal ini bertujuan untuk memprediksi kapan dan dimana gempa yang berkekuatan besar itu akan berpotensi besar terjadi. Salah satu metode statistika yang dapat digunakan untuk memecahkan masalah ini adalah pemodelan Bayesian. Penelitian ini menggunakan data gempa bumi di Jawa Barat pada tahun 1960-2009. Data tersebut berupa variabel lintang, bujur, kedalaman pusat gempa, dan kekuatan gempa. Variabel lintang, bujur, dan kedalaman pusat gempa digunakan untuk mengelompokkan titik-titik gempa menjadi wilayah-wilayah rawan gempa dengan menggunakan metode two step cluster. Selanjutnya, pemodelan bayesian dilakukan di setiap wilayah rawan gempa tersebut untuk memprediksi probabilitas kemunculan gempa berkekuatan besar di daerah ini. Ternyata wilayah yang memiliki potensi kemunculan gempa berkekuatan besar yang cukup tinggi adalah kabupaten Garut, Bandung, dan laut Indonesia."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2010
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aldila Fitrilia
"ABSTRAK
Analisis survival merupakan analisis statistika yang digunakan untuk menyelidiki waktu tahan hidup suatu benda atau individu pada keadaan tertentu. Dalam melakukan analisis survival dibutuhkan data survival yang meliputi waktu survival dan status waktu survival dari objek yang diteliti. Data survival yang diperoleh dapat berupa data lengkap atau data tidak lengkap. Data tidak lengkap data tersensor dapat berupa data tersensor kanan, kiri, atau interval. Data tersensor kanan dapat berupa data tersensor kanan tipe I atau data tersensor kanan tipe II. Dalam penelitian ini akan digunakan data tersensor kanan tipe II. Fungsi survival yang akan digunakan adalah fungsi survival dari distribusi Lomax. Distribusi Lomax memiliki dua paremeter, yaitu parameter bentuk dan parameter skala. Dalam penelitian ini, parameter yang akan ditaksir adalah parameter bentuk dengan asumsi parameter skala telah diketahui. Metode yang digunakan dalam penelitian ini adalah metode Bayes. Penelitian ini akan menggunakan prior Gamma sebagai distribusi conjugate prior dan fungsi Loss yang akan digunakan dalam penelitian ini adalah balanced squared error loss function BSELF .

ABSTRACT
Survival analysis is a statistical analysis used to investigate the life time of an object or an individual in a special case. In survival analysis, survival data is needed which includes the survival time and status of the survival time of the object under study. The survival data obtained can be either complete data or incomplete data. Incomplete data censored data can be either right, left, or interval censored data. The right censored data can be either right censored data type I or type II. In this study will be used the right censored data type II. The survival function to be used is the survival function of the Lomax distribution. The Lomax distribution has two parameters, that is the shape parameter and the scale parameter. In this study, the parameter will be estimate is the shape parameter with the assumption of scale parameters has been known. The method used in this study is Bayes method. This study will use prior Gamma as conjugate prior distribution and Loss function will be used in this study is balanced squared error loss function BSELF."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>