Hasil Pencarian

Ditemukan 13524 dokumen yang sesuai dengan query

Ivana Ratanaputri

Model Regresi Bayesian Zero-Inflated Bernoulli = Bayesian Zero-Inflated Bernoulli Regression Model

"Data biner merupakan tipe data yang memiliki tepat dua kemungkinan nilai, seperti sukses dan gagal atau ya dan tidak, yang lebih lanjut direpresentasikan dalam respon 0 dan 1. Data biner kerap dijumpai dalam kehidupan sehari-hari. Namun, tidak jarang pula ditemukan data biner yang mengalami zero-inflation. Fenomena zero-inflation ini merujuk kepada data dengan dua sumber nilai nol yang berbeda, yang dikenal dengan istilah structural zeros dan sampling zeros. Oleh karena itu, dikembangkanlah suatu model alternatif, yakni model regresi Zero-Inflated Bernoulli untuk memodelkan data biner yang mengalami zero-inflation. Dalam inferensi statistika, terdapat dua jenis pendekatan yang umumnya digunakan, yaitu pendekatan frekuentis dan pendekatan Bayesian. Pada tugas akhir ini, dikonstruksi suatu model regresi Zero-Inflated Bernoulli menggunakan pendekatan Bayesian. Pendekatan Bayesian digunakan karena dianggap lebih unggul dibandingkan pendekatan frekuentis. Dalam data yang mengalami zero inflation, pendekatan frekuentis tidak mampu membedakan structural zeros dan sampling zeros. Hasil konstruksi model yang terbentuk diberi nama model regresi Bayesian Zero-Inflated Bernoulli. Salah satu hal penting dalam pendekatan Bayesian adalah mendapatkan distribusi posterior. Namun, sering kali nilai parameter dari distribusi posterior sulit ditemukan secara analitik karena distribusi posteriornya memiliki formula terbuka. Oleh karena itu, dalam tugas akhir ini estimasi parameter sekaligus pembangunan sampel posterior dicari melalui teknik komputasional dengan algoritma No-U-Turn Sampler (NUTS). Selanjutnya, model regresi Bayesian Zero-Inflated Bernoulli diimplementasikan untuk masalah klasifikasi pada data sickness presenteeism. Dalam tugas akhir ini, dibangun dua buah model regresi Bayesian Zero-Inflated Bernoulli, yakni model tanpa kovariat dan model dengan kovariat. Dari model tanpa kovariat, diperoleh estimasi parameter distribusi variabel respon adalah p1 = 0.38 dan p2 = 0.75. Lebih lanjut, hasil estimasi probabilitas yang diperoleh mendekati nilai empirisnya. Pada model dengan kovariat, digunakan dua kovariat untuk dua bagian yang berbeda, yakni evaluasi kondisi kesehatan (gh) pada seluruh sampel dan kovariat frekuensi merasakan perasaan takut tergantikan apabila tidak masuk kerja (remplz) pada sampel at-risk, hasil estimasi parameter regresi akan menghasilkan persamaan regresi yang dapat digunakan memberikan prediksi klasifikasi variabel respon kondisi pekerja yang masuk kerja pada saat sedang sakit. Diperoleh, berturut-turut tingkat akurasi dari model dengan kovariat gh dan kovariat remplz adalah sebesar 72.44% dan 69.58%, tingkat sensitivitas sebesar 14.65 % dan 100.00%, serta tingkat specificity sebesar 94.35% dan 0.00%.

Binary data is type of data that have exact two outcomes, for instance, success and failure or yes and no, that usually represent in 0 and 1. Binary data can be easily find on daily basis. However, there is binary data that experienced with zero-inflation. Zero-inflation phenomenon is caused by two different sources of zeros, which is called structural zeros and sampling zeros. Therefore, Zero-Inflated Bernoulli regression model is constructed for modeling binary data that experienced zero-inflation. There are two statistical inferences that is commonly used, that is frequentist and Bayesian inference. This thesis constructed Zero-Inflated Bernoulli regression model with Bayesian inference. Bayesian inference is selected because it is more superior than frequentist inference on modeling binary data with two different source of zeros. Frequentist inference unable to distinguish the difference between structural zeros and sampling zeros. Constructed model is called Bayesian Zero-Inflated Bernoulli regression model. In Bayesian inference, it is important to get the predicted posterior distribution. However, in some cases, the analytic estimation of the posterior distribution is difficult to calculate because it has open formula. Therefore, posterior estimator is searched using computational techniques name No-U-Turn Sampler algorithm (NUTS). Furthermore, this regression model is implemented on classification problem sickness presenteeism data. In this thesis, we constructed two models, that is model without covariates dan model with covariates. From model without covariates, the parameter from response variable distribution can be estimated and we got p1 = 0.38 dan p2 = 0.75. This results is closed to the empirical value. Then, from model with covariates, two covariates is considered on implementation for different parts, i.e. general state of health (gh) covariate for all sample and feeling for being replaced (remplz) covariate for at-risk sample. From the estimated regression parameters, the regression equation is able give classification predictions for attend work while sick as response variable (sp recod). The results are the model give 72.44% and 69.58% accuracy rate."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Azizah Awaliah

Metode bayesian untuk menaksir parameter dalam model regresi Zero-Inflated Poisson (ZIP) = Bayesian method to estimate the parameters of Zero Inflated Poisson (ZIP) regresion model

"Regresi Poisson sering digunakan untuk menganalisis data diskrit count data. Regresi ini memiliki asumsi equidispersi. Namun, dalam banyak kasus sering dijumpai asumsi tersebut tidak terpenuhi karena adanya overdispersi pada data. Salah satu penyebab overdispersi adalah excess zero. Model regresi yang dapat digunakan untuk mengatasi masalah tersebut adalah regresi Zero-Inflated Poisson ZIP . Regresi ZIP menyelesaikan masalah excess zero dengan mengidentifikasi structural zeros di tahap pertama dan model Poisson counts di tahap kedua. Pada penelitian ini, parameter regresi ditaksir menggunakan metode Bayesian. Pada metode Bayesian, unsur ketidakpastian parameter dipertimbangkan model dalam bentuk distribusi prior. Dengan mengombinasikan distribusi prior dan likelihood, diperoleh distribusi posterior dari parameter yang menjadi perhatian dalam penelitian. Teknik komputasional Markov Chain Monte Carlo-Gibbs Sampling MCMC-GS digunakan untuk melakukan sampling nilai-nilai parameter dari distribusi posterior tersebut. Metode ini kemudian diterapkan untuk memodelkan frekuensi komplikasi motorik pada 215 penderita penyakit Parkinson. Diperoleh hasil bahwa total skor MDS-UPDRS Part 2 dan 3 berasosiasi dengan konsumsi atau tidaknya obat-obatan pada pasien. Lebih lanjut, untuk mereka yang mengonsumsi obat, total skor MDS-UPDRS Part 1 berasosiasi dengan frekuensi komplikasi motorik.

Poisson regression is commonly used for analizing count data. This method requires equidispersion assumption. However, in the case of overdispersion, this assumption is not always fulfilled. Overdispersion may exist when there is excess zeros in the data. One of the regression models which might solve it is Zero Inflated Poisson ZIP regression. ZIP regression solves the excess zero problem by identifying the structural zeros at the first stage, then Poisson counts model at the second stage. In this research, the regression parameters are estimated using Bayesian method. Bayesian method acomodates the uncertainty parameters through prior distribution. Combining the prior distribution and likelihood from the data results in the posterior distribution of the parameters of interest. True parameters are then sampled using Markov Chain Monte Carlo Gibbs Sampling MCMC GS. Therefore, this method is applied to model the frequency of motor complications in 215 Parkinson 39 s disease patients. The result shows that total score of MDS UPDRS Part 2 and 3 associated with those taking the medicines or not. Furthermore, for those taking the medicines, total score of MDS UPDRS Part 1 associated with motor complications frequency."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Shafira

Metode bayesian untuk model regresi Zero Inflate Negative Binomial (ZINB) = Bayesian method for zero inflated negative binomial regression model shafira

"Model regresiZero Inflated Poisson (ZIP) digunakan untuk memodelkan count data dengan overdispersi yang disebabkan oleh nilai nol yang berlebih pada pengamatannya(excess zero). Namun, ketika overdispersi berasal dariexcess zerodan datacount, makaZIP tidak lagi cocok. Model regresi Zero Inflated Negative Binomial (ZINB) bertujuan untuk mengetahui variabel apa saja yang berpengaruh secara signifikan terhadap variabelrespon. Data untuk regresi ZINB ini memiliki dua sumber overdispersi. Terdapat dua proses pada variabel respon, yang mendasari pengamatan masuk ke dalam structural zeros atau Negative Binomial (NB) counts. Jadi, regresi ZINB terdiri dari dua model. Pada kedua model tersebut dilakukan penaksiran parameter menggunakan metode Bayesian. Metode ini menganggap parameter-parameter yang digunakan merupakan variabel acakyang memiliki distribusi sebagai informasi prior, dan mengkombinasikannya dengan data yang dimiliki. Kombinasi tersebut selanjutnya disebut sebagai distribusi posterior. Sampling parameter dari distribusi posterior dilakukan dengan simulasi Markov Chain Monte Carlo (MCMC). Sebagai penerapan, digunakan data Parkinson dari Parkinsons Progression Markers Initiative (PPMI). Variabel responnya yaitu frekuensi seberapa sering pasien mengalami komplikasi setelah meminum obat atau tidak, dan variabel prediktornya berupa skor pemeriksaan aspek motorik, non-motorik, dan respon-respon tubuh. Diperoleh hasil bahwa model ZINB cocok untuk memodelkan data tersebut yangditandai dengan hasil simulasi yang konvergen.

Zero Inflated Poisson (ZIP) regression model is a standard framework for modeling discrete data with over-dispersion caused by excess zero. When over-dispersion has comefrom excess zero and count data, ZIP is no longer matches. A Zero Inflated Negative Binomial (ZINB) regression model aims to analyze the variables affecting data with two sources of over-dispersion. Hence there are two processes at the response variable, which make an observation classified as structural zeros or Negative Binomial (NB) counts. So, ZINB regression consists oftwo models. This paper will use Bayesian method forestimating parameter in both models. The Bayesian method considers parameters to bea random variable that has distribution known as prior distribution, and combine with information of the data. This combination referred as posterior distribution. Sampling parameter from posterior distribution is done using Markov Chain Monte Carlo (MCMC) simulation. As an application, the Parkinsons data is used from Parkinsons Progression Markers Initiative (PPMI). Frequency of how often the patient has complications aftertaking the drug or not is the response, and the predictive variables are motoric aspect, non-motoric aspect, and body responses test scores. The simulation result shows that it isconvergent, indicate that ZINB model is suitable for modeling Parkinsons data."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Analisis kasus penyakit filariasis di Provinsi Nangroe Aceh Darussalam denggan pendekatan metode zero inflated poisson (ZIP) regression

"Latar belakang: Indonesia merupakan salah satu negara tropis yang menjadi kawasan endemik penyakit tropis, salah satunya adalah penyakit filariasis (kaki gajah). Penyakit filariasis disebabkan oleh infeksi cacing filaria yang ditularkan oleh gigitan nyamuk. Data Riset Kesehatan Dasar (Riskesdas) 2007 menunjukkan bahwa persentase penderita filariasis di Provinsi Nangroe Aceh Darussalam (NAD) berada pada urutan pertama terbesar di Indonesia (6,4‰). Metode: Analisis

data sekunder yang berasal dari data Riskesdas tahun 2007. Unit analisis adalah individu yang tersampel di Provinsi NAD. Fokus riset pada hubungan antara penderita filariasis di Provinsi NAD dengan faktor yang mempengaruhinya. Metode yang digunakan adalah Regresi Poisson dan Zero Inlated Poisson (ZIP). Hasil: Peluang dari 10.000 RT yang dapat terkena penyakit filariasis adalah sebanyak 72 rumah tangga dan peluang dari 10.000 penduduk di provinsi NAD yang dapat terkena penyakit filariasis adalah sebanyak 25 penduduk. Individu yang tidur tidak menggunakan kelambu berisiko 1,60 terkena

filariasis dibandingkan yang tidur menggunakan kelambu. Sedangkan individu yang rumahnya tidak terdapat saluran limbah berisiko 3,47 menderita filariasis daripada yang memiliki saluran limbah. Kesimpulan: Variabel berpengaruh pada kejadian filariasis di NAD yaitu rata-rata jarak ke pelayanan kesehatan terdekat, rata-rata jarak ke sumber air dan persentase rumah tangga yang menggunakan kelambu berinsektisida saat tidur malam. Makin jauh jarak ke pelayanan dan jarak sumber air,

akan meningkatkan kejadian filariasis. Sedangkan makin banyak yang menggunakan kelambu berinsektisida saat tidur malam, akan menurunkan kejadian filariasis. Saran: Perlu analisis lanjut model pemetaan (spasial) pelayanan kesehatan. Kabupaten yang perlu mendapat perhatian adalah, Aceh Timur, Aceh Utara, Nagan Raya dan Aceh Besar."

613 BULHSR 17:1 (2014)

Artikel Jurnal Universitas Indonesia Library

Dickson Dichandra

Penaksiran parameter pada regresi kuantil bayesian = Parameter estimation of bayesian quantile regression

"Regresi kuantil adalah metode regresi yang menghubungkan kuantil dari variabel respon dengan satu atau beberapa variabel prediktor. Regresi kuantil memiliki kelebihan yang tidak dimiliki oleh regresi linier yaitu robust terhadap outlier dan dapat memodelkan data yang heteroskedastisitas. Regresi kuantil dapat diestimasi parameternya dengan metode Bayesian.

Metode Bayesian adalah alat analisis data yang diturunkan berdasarkan prinsip inferensi Bayesian. Inferensi Bayesian adalah proses mempelajari analisis data secara induktif dengan teorema Bayes. Untuk menaksir parameter regresi dengan inferensi Bayesian, perlu dicari distribusi posterior dari parameter regresi dimana distribusi posterior proporsional terhadap perkalian distribusi prior dan fungsi likelihoodnya. Karena perhitungan distribusi posterior secara analitik sulit untuk dilakukan jika semakin banyak parameter yang ditaksir, maka diajukan metode Markov Chain Monte Carlo (MCMC). Penggunaan metode Bayesian dalam regresi kuantil memiliki kelebihan yaitu penggunaan MCMC memiliki kelebihan yaitu mendapatkan sampel nilai parameter dari distribusi posterior yang tidak diketahui, penggunaan

yang efisien secara komputasi, dan mudah diimplementasikannya. Yu dan Moyeed (2001) memperkenalkan regresi kuantil Bayesian dengan menggunakan fungsi likelihood dari error yang berdistribusi Asymmetric Laplace Distribution (ALD) dan menemukan bahwa

meminimumkan taksiran parameter pada regresi kuantil sama dengan memaksimalkan fungsi likelihood dari error yang berdistribusi Asymmetric Laplace Distribution (ALD). Metode yang digunakan untuk menaksir parameter regresi kuantil adalah Gibbs sampling dari distribusi ALD yang merupakan kombinasi dari distribusi eksponensial dan Normal. Penaksiran parameter model regresi dilakukan dengan cara pengambilan sampel pada distribusi posterior

dari parameter regresi yang ditemukan dalam skripsi ini. Pengambilan sampel pada distribusi posterior dapat menggunakan metode Gibbs sampling. Hasil yang diperoleh dari Gibbs sampling berupa barisan sampel parameter yang diestimasikan. Setelah mendapatkan barisan sampel, barisan sampel dirata-ratakan untuk mendapatkan taksiran parameter regresinya. Studi kasus dalam skripsi ini adalah membahas pengaruh faktor risiko dari nasabah asuransi kendaraan bermotor terhadap besar klaim yang diajukan oleh nasabah.

Quantile regression is a regression method that links the quantiles of the response variable with one or more predictor variables. Quantile regression has advantages that linear regression does not have; it is robust against outliers and can model heteroscedasticity data.
The parameters of quantile regression can be estimated using the Bayesian method. The Bayesian method is a data analysis tool derived based on the Bayesian inference principle.
Bayesian inference is the process of studying data analysis inductively with the Bayes theorem. To estimate regression parameters with Bayesian inference, it is necessary to find the posterior distribution of the regression parameters where the posterior distribution is
proportional to the product of the prior distribution and its likelihood function. Since the calculation of the posterior distribution analytically is difficult to do if the more parameters are estimated, the Markov Chain Monte Carlo (MCMC) method is proposed. The use of the Bayesian method in quantile regression has advantages, namely the use of MCMC has the advantages of obtaining sample parameter values from an unknown posterior distribution,
using computationally efficient, and easy to implement. Yu and Moyeed (2001) introduced Bayesian quantile regression using the likelihood function of errors with an Asymmetric Laplace Distribution (ALD) distribution and found that minimizing parameter estimates in quantile regression is the same as maximizing the likelihood function of errors with an Asymmetric Laplace Distribution (ALD) distribution. The method used to estimate quantile regression parameters is Gibbs sampling from the ALD distribution, which is a combination
of the exponential and normal distributions. The estimation of the regression model parameters is done by sampling the posterior distribution of the regression parameters which is found in this thesis. Gibbs sampling method is used to sampling the posterior distribution.
The results obtained from Gibbs sampling are a sample sequence of estimated parameters.
After obtaining the sample sequences, the sample lines are averaged to obtain an estimated regression parameter. The case study in this thesis discusses the effect of risk factors from motor vehicle insurance customers on the size of claims submitted by customers."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Tri Handhika

Penggunaan metode empirical best linear unbiased prediction (EBLUP) pada general linear mixed model

"Tugas Akhir ini bertujuan untuk mencari taksiran parameter pada General Linear Mixed Model. Parameter-parameter dalam General Linear Mixed Model merupakan parameter untuk melihat efek fixed dan efek random dari variabel-variabel prediktor terhadap variabel respon. Salah satu metode yang digunakan untuk mencari taksiran parameter pada General Linear Mixed Model adalah Metode Empirical Best Linear Unbiased Prediction (EBLUP).

Berbeda dengan Metode Best Linear Unbiased Prediction (BLUP) di mana parameter dari variansi efek random-nya diketahui, Metode EBLUP memerlukan penaksiran terhadap parameter tersebut yang pada kenyataannya tidak diketahui nilainya. Metode yang digunakan untuk menaksir parameter dari variansi efek random ini ialah Metode Maximum Likelihood (ML). Kemudian, Metode EBLUP dilanjutkan dengan mensubstitusikan taksiran parameter dari variansi efek random ke dalam taksiran parameter pada General Linear Mixed Model yang diperoleh melalui prosedur penaksiran dengan menggunakan Metode BLUP."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2008

S27692

UI - Skripsi Open Universitas Indonesia Library

Tatarinova, Tatiana

Nonlinear mixture models : a bayesian approach

London: Imperial College Press, 2015

519.233 TAT n

Buku Teks SO Universitas Indonesia Library

Amanda Putri Tiyas Pratiwi

Model cox piecewise constant hazard dengan metode Bayesian = Cox piecewise constant hazard model with Bayesian method

"Model Cox merupakan model yang sering digunakan untuk menganalisis time-tovent data, yaitu data yang pengamatannya bergantung pada waktu. Terkadang, Selain informasi tentang waktu, data time-to-event juga dilengkapi dengan informasi tambahan (variabel penjelas). Analisis data waktu ke acara seperti ini dengan menggunakan model Cox akan menghasilkan perkiraan bahaya. Model Cox memiliki dua komponen utama yaitu baseline hazard dan mengandung fungsi eksponensial koefisien regresi. Bahaya didefinisikan sebagai produk antara dua komponen ini. Untuk dapat memperoleh bahaya spesifik, bahaya baseline dan koefisien regresi di model Cox harus diperkirakan. Dalam tesis ini, asumsi konstanta akan didefinisikan sebagai bahaya dasar dari model Cox. Kemudian, konstanta dan koefisien regresi dimasukkan Model ini akan diestimasi dengan menggunakan metode Bayesian dimana sampel diambil Parameter distribusi posterior dilakukan dengan menggunakan metode Markov chain Monte Carlo dengan algoritma pengambilan sampel Gibbs. Untuk metode Bayesian, distribusi sebelumnya untuk Bahaya baseline diasumsikan mengikuti distribusi gamma dan untuk koefisien regresi diasumsikan mengikuti distribusi normal. Data EKG (echocardiogram) yang terdiri dari

106 observasi dan enam variabel penjelas digunakan dalam analisis. Mendapatkan hasil bahwa estimasi parameter yang diperoleh konvergen.

The Cox model is a model that is often used to analyze time-to-event data, namely data whose observations are time dependent. Sometimes, in addition to information about time, time-to-event data is also supplemented with additional information (explanatory variables). Analysis of time-to-event data like this using the Cox model will yield hazard estimates. The Cox model has two main components, namely the baseline hazard and contains an exponential regression coefficient function. Hazard is defined as a product between these two components. In order to obtain a specific hazard, the baseline hazard and regression coefficient in the Cox model must be estimated. In this thesis, the constant assumption will be defined as the basic hazard of the Cox model. Then, the constants and regression coefficients are entered. This model will be estimated using the Bayesian method where the sample is taken. Posterior distribution parameters are carried out using the Markov chain Monte Carlo method with the Gibbs sampling algorithm. For the Bayesian method, the previous distribution for baseline hazard is assumed to follow the gamma distribution and for the regression coefficient it is assumed to follow a normal distribution. EKG (echocardiogram) data which consists of
106 observations and six explanatory variables were used in the analysis. Obtain the result that the parameter estimates obtained are convergent."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Basith Abi Ya'la

Pembentukan Model Regresi Double Poisson = The Construction of Double Poisson Regression Models

"Untuk memodelkan data cacah atau count data, model regresi yang biasa digunakan adalah model regresi Poisson. Model regresi Poisson mengasumsikan mean pada variabel respon sama dengan variansinya atau dikenal dengan istilah equidispersion. Apabila regresi Poisson digunakan untuk kondisi selain equidispersion, yaitu overdispersion dan underdispersion, maka nilai standard error dari estimasi parameter model menjadi tidak konsisten. Salah satu alternatif model regresi untuk mengatasi overdispersion maupun underdispersion adalah model regresi double Poisson. Model regresi double Poisson mengasumsikan variabel respon berdistribusi double Poisson. Distribusi double Poisson diperoleh menggunakan definisi dari keluarga distribusi double eksponensial. Parameter pada model regresi double Poisson diestimasi menggunakan metode maksimum likelihood dan solusi dari persamaan log-likelihoodnya diselesaikan menggunakan metode numerik Newton-Raphson. Penerapan model regresi double Poisson pada data kepiting tapal kuda menunjukan bahwa hanya variabel weight yang berpengaruh signifikan terhadap banyak kepiting satelit yang berkerumun ke sarang kepiting tapal kuda betina. Selain itu, interpretasi dari model regresi double Poisson juga serupa dengan model regresi Poisson sebab keduanya menggunakan fungsi penghubung log.

To model count data, the most commonly used regression model is the Poisson regression model. The Poisson regression model assumes that the mean of the response variable is equal to the variance, also known as equidispersion. If Poisson regression is used for conditions other than equidispersion, namely overdispersion and underdispersion, then the standard error value of the estimated model parameters becomes inconsistent. One of the alternative regression models to overcome overdispersion and underdispersion is the double Poisson regression model. The double Poisson regression model assumes that the response variable has a double Poisson distribution. The double Poisson distribution is obtained using the definition of the double exponential distribution family. The parameters in the double Poisson regression model were estimated using the maximum likelihood method and the solutions of the log-likelihood equation were solved using the Newton-Raphson numerical method. The application of the double Poisson regression model to the horseshoe crab data shows that only the variable weight has a significant effect on the number of satellite crabs swarming to the nests of female horseshoe crabs. In addition, the interpretation of the double Poisson regression model is also similar to the Poisson regression model because both use a log link function."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Rida Martiza

Model Regresi Zero-and-One-Inflated Poisson = Zero-and-One-Inflated Poisson Regression Model

"Regresi Poisson merupakan generalized linear models (GLM) yang umum digunakan untuk memodelkan hubungan antara variabel respon berbentuk count data dengan satu atau lebih kovariat. Hanya saja, kerap dijumpai count data yang tidak memenuhi asumsi equidispersion sehingga tidak dapat dimodelkan dengan regresi Poisson. Salah satu penyebabnya adalah fenomena overdispersion yang teridentifikasi dengan banyaknya observasi yang bernilai nol (excess zeros) pada count data. Model regresi Zero-Inflated Poisson (ZIP) dapat digunakan untuk memodelkan count data yang mengalami overdispersion akibat excess zeros. Namun, pada beberapa kasus, count data dapat mengandung excess zeros dan excess ones dalam suatu periode waktu tertentu. Oleh karena itu, diperkenalkan solusi atas permasalahan tersebut menggunakan sebuah distribusi baru, yaitu distribusi Zero-and-One-Inflated Poisson (ZOIP), yang dibangun berdasarkan distribusi Bernoulli dan Poisson. Pada skripsi ini, dikonstruksi model regresi ZOIP untuk memodelkan count data yang mengandung excess zeros dan excess ones dalam suatu periode waktu tertentu. Parameter model regresi ZOIP tersebut diestimasi menggunakan metode maksimum likelihood dan algoritma Expectation Maximization (EM). Selanjutnya, diaplikasikan model regresi ZOIP dengan satu kovariat dan tanpa kovariat ke data klaim asuransi mobil. Berdasarkan nilai Akaike Information Criteria (AIC), didapatkan bahwa model regresi tanpa kovariat lebih cocok untuk memodelkan data klaim asuransi mobil yang dipakai.

Poisson regression is a generalized linear model (GLM) that is commonly used to model the relationship between response variables in the form of count data with one or more covariates. However, it is often found that count data does not meet the equidispersion assumption, so it cannot be modeled using Poisson regression. One of the causes is the phenomenon of overdispersion which is identified by the number of observations that are zero (excess zeros) in the count data. The Zero-Inflated Poisson (ZIP) regression model can be used to model count data that experiences overdispersion due to excess zeros. However, in some cases, count data may contain excess zeros and excess ones in a certain period of time. Therefore, a solution to this problem was introduced using a new distribution, namely the Zero-and-One-Inflated Poisson (ZOIP) distribution, which was built based on the Bernoulli and Poisson distribution. In this thesis, a ZOIP regression model is constructed to model count data containing excess zeros and excess ones in a certain period of time. The parameters of the ZOIP regression model are estimated using the maximum likelihood method and the Expectation Maximization (EM) algorithm. Furthermore, the ZOIP regression model with a covariate and without covariates were applied to the car insurance claim data. Based on the Akaike Information Criteria (AIC) value, it was found that the regression model without covariates is more suitable for modeling the car insurance claim data used."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian