Untuk melaksanakan penelitian di Indonesia yang dapat mewakili 33 provinsi, sampling bertahap banyak dilakukan, dan tahap awalnya adalah memilih provinsi. Pada penelitian bidang kesehatan, agar provinsi terpilih mewakili kondisi kesehatan penduduk Indonesia, seyogyanya provinsi dikelompokkan berdasarkan variabel terkait kesehatan. Untuk itu, secara statistik dapat dilakukan analisis gugus (cluster analysis) memakai data dari berbagai sumber, dengan 27 variabel mencakup prevalensi beberapa penyakit infeksi dan status gizi, akses ke pelayanan kesehatan, status demografi, indeks pembangunan manusia, dan aspek keuangan. Hasil akhir menunjukkan bahwa ada 4 gugus provinsi di Indonesia, pada masing-masing gugus terdapat sebanyak 4, 8, 7, dan 14 provinsi. Proses penggugusan dengan analisis gugus semacam ini dapat diterapkan dengan memakai data yang diperbaharui dan hasilnya dapat dimanfaatkan sebagai salah satu pertimbangan untuk sampling provinsi di Indonesia.
A multistage sampling procedure is often used in conducting a researchthat represents all 33 provinces in Indonesia, and the first step for the procedure is the sample selection of provinces. In the area of health research, it is recommended that the province selection is based on the stratification of provinces using health related variables. Cluster analysis is a statistical technique possibly employed utilizing data from many sources. In this particular application, it involves 27 important health variables which reflect important communicable diseases and nutritional status, access to health services, demographic situation, human development index, and financial factor. This cluster analysis produces four clusters of province, with each of them comprising of 4, 8, 7, and 14 provinces. This statistical clustering technique of provinces can be implemented and considered in the sampling process of provinces in Indonesia using the updated data.