Ditemukan 2 dokumen yang sesuai dengan query
Catur Adi Nugroho
"Laporan Tugas Akhir ini berisi mengenai penelitian yang dilakukan oleh penulis dalam membandingkan kinerja beberapa algoritma, yang tergolong ke dalam agglomerative hierarchical, dalam hal melakukan clustering dokumen untuk mendapatkan solusi hierarchical cluster. Algoritma yang diperbandingkan adalah algoritma single link, complete link, dan average. Proses perbandingan dilakukan berdasarkan kualitas cluster yang dihasilkan pada sejumlah dataset. Hasil penelitian menunjukkan bahwa algoritma average merupakan algoritma yang terbaik dalam menghasilkan solusi hierarchical cluster, diikuti oleh algoritma single link, dan algoritma complete link.
Penelitian ini juga melakukan penerapan teknik dalam feature selection untuk melihat seberapa besar efisiensi yang bisa diperoleh tanpa harus mengurangi kualitas solusi cluster yang dihasilkan. Teknik feature selection yang dipergunakan meliputi pembatasan nilai Document Frequency dan Information Gain. Efisiensi yang dilakukan oleh kedua teknik ini adalah melakukan pemilihan kata-kata yang penting saja yang diikutsertakan dalam proses clustering. Penelitian ini mencoba melihat seberapa besar efisiensi yang dapat diperoleh masing-masing teknik dan kemudian membandingkannya satu sama lain. Hasil penelitian menunjukkan bahwa kedua teknik baik pembatasan nilai Document Frequency dan Information Gain mampu melakukan efisiensi pada titik-titik reduksi yang sudah ditetapkan yaitu sebesar 10%-90% dari jumlah kata unik yang ada tanpa kualitas yang berkurang. Selain itu, hasil penelitian menunjukkan bahwa kedua teknik ini sama efektifnya dalam mereduksi dimensi dari dataset yang dipergunakan."
Depok: Universitas Indonesia, 2007
S-Pdf
UI - Skripsi Membership Universitas Indonesia Library
Elisabeth Martha Koeanan
"Image clustering adalah pengelompokan citra berdasarkan kesamaan ciri tententu pada sekumpulan citra. Image clustering yang dilakukan berdasarkan konten citra dapat menggunakan komponen warna, tekstur, garis tepi, bentuk, dan lainnya, atau berupa gabungan dari beberapa komponen. Pada penelitian ini dilakukan image clustering berdasarkan komponen warna. Tiga hal yang diperhatikan dalam proses clustering ini adalah penggunaan ruang warna, representasi citra, dan metode clustering. Ruang warna yang digunakan dalam penelitian ini adalah RGB, HSV, dan L*a*b*. Representasi citra atau feature extraction menggunakan histogram dan Gaussian Mixture Model, sedangkan metode clustering yang digunakan adalah K-Means dan Agglomerative Hierarchical. Pada ruang warna RGB dan L*a*b*, kinerja clustering terbaik berhasil dilakukan dengan menggunakan representasi citra GMM, sedangkan pada ruang warna HSV, citra yang berhasil dikelompokan dengan kinerja paling baik menggunakan representasi citra histogram. Kemudian, metode K-Means clustering bekerja lebih baik daripada Agglomerative Hierarchical pada image clustering yang menggunakan komposisi warna.
Image clustering is a process of grouping the image based on their similarity. Image clustering based on image content usually uses the color component, texture, edge, shape, or mixture of two components, etc. This research focuses in image clustering uses color component. Three main concepts concerned on this research are color space, image representation (feature extraction), and clustering method. RGB, HSV, and L*a*b* are used in color spaces. The image representations use Histogram and Gaussian Mixture Model (GMM), whereas the clustering methods are K-Means and Agglomerative Hierarchical Clustering. The result of the experiment show that GMM representation is better used for RGB and L*a*b* color space, whereas Histogram is better used for HSV. The experiment also show that K-Means better than Agglomerative Hierarchical for clustering method."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
S-Pdf
UI - Skripsi Open Universitas Indonesia Library