Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 161168 dokumen yang sesuai dengan query
cover
Farid Prasaja Putera
"ABSTRAK
Peningkatan kualitas citra medis khususnya untuk bagian kepala manusia terus dikembangkan, termasuk dengan pemodelan 3D. Hal ini dilakukan untuk mengurangi kesalahan dalam proses diagnosa dan memfasilitasi pendeteksian tumor otak dengan pendekatan 3D. Dalam prosesnya, citra MRI otak dianalisa secara 3D sehingga diperoleh bagian tumor otak. Citra MRI dikonversi dari citra berformat MINC. Citra diklasifikasi untuk mendeteksi objek menggunakan K-Means Clustering yang akan memisahkan bagian tumor dan otak. Proses filter dilakukan menggunakan Non-Local Means sehingga noise hasil pengolahan dapat berkurang dari proses sebelumnya. Hasil citra pengolahan disegmentasi untuk meningkatkan dan mendukung proses rekonstruksi menggunakan Thresholding. Terakhir adalah merekonstruksi citra dalam bentuk 3D menggunakan metode Marching Cube. Evaluasi akurasi sistem meliputi pengurangan resolusi, pengujian citra normal, uji perbandingan, penggantian format citra dan penambahan noise. Hasil akurasi pendeteksian tumor otak mencapai 100% untuk format PNG dan resolusi 512x512, 97,7% untuk resolusi 256x256, 96,9% untuk citra normal tanpa tumor dan 97,96% berdasarkan perbandingan data olah dengan data referensi. Format PNG memiliki akurasi dibandingkan format JPEG dengan perbedaan sebesar 4%. Pengujian dengan menambahkan noise menghasilkan akurasi 87,6% untuk densitas 0,01, 83,6% untuk 0,05 dan 74,5% untuk 0,09.

ABSTRACT
Medical image enhancement especially for human brain imageries is rapidly developed, including 3D modeling. This research is aimed to reduce the error of diagnosis process and facilitate brain tumor detection using 3D approach. In the process, 3D brain from MRI imageries is analyzed to detect brain tumors. MRI image is converted from MINC format. Then, the image is classified to detect objects using K-Means Clustering to divide each part of brain. Filtering is performed using Non-Local Means to remove noise from previous processes. The result of imageries are segmented to enhance and support reconstruction process using Thresholding. Finally, 3D image reconstruction is performed using Marching Cube method. The accuracy of brain tumor detection is evaluated of resolution reduction, non tumor image testing, comparison testing, modifying image format, and adding noise. The accuracy rate of brain tumor detection is 100% for PNG format and 512x512 resolution, 97,7% for 256x256 resolution, 96,9% for non tumor image and 97,96% for comparison between ideal image and reference data. PNG format has better accuracy with JPEG by 4% improvement. The accuracy of adding noise is 87,6% for 0,01 density, 83,6% for 0,05 and 74,5% for 0,09."
2016
S64517
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dewi Holilah
"Penyakit Alzheimer merupakan bentuk umum dari gangguan neurodegeneratif yang ditandai dengan rusaknya sel-sel otak, seperti kusutnya neurofibrillary dan adanya plak amiloid yang bersifat progresif. Salah satu ciri fisik seseorang menderita penyakit Alzheimer adalah adanya penyusutan luas daerah hippocampus pada otak. Hippocampus merupakan bagian terkecil dari otak yang berfungsi menyimpan memori. Deteksi penyakit Alzheimer dapat dilakukan dengan menggunakan Magnetic Resonance Image MRI yang merupakan satu teknik non inovasif untuk analisis struktur otak pada penderita Alzheimer.
Pada penelitian ini, digunakan metode K-Means Clustering dan Watershed untuk mensegmentasi daerah hippocampus yang merupakan salah satu bagian otak yang diserang ketika terkena penyakit Alzheimer. Analisis yang dilakukan untuk mendeteksi Alzheimer, yaitu membandingkan nilai threshold dengan jumlah piksel putih pada citra. Data yang digunakan pada penelitian ini yaitu Open Acess Series of Image Studies OASIS database dengan menggunakan citra potongan koronal. Berdasarkan hasil percobaan, antara metode K-Means Clustering dan Watershed keduanya dapat mensegmentasi daerah hippocampus untuk mendeteksi penyakit Alzheimer.

Alzheimer 39s disease is a common form of neurodegenerative disorders characterized by defective brain cells, such as neurofibrillary tangles and amyloid plaque that is progressive. One of the physical characteristics of someone suffering from Alzheimer 39s disease is shrinking of the hippocampus area of the brain. The hippocampus is the smallest part of the brain that serves to save memory. The detection of Alzheimer 39s disease can be done using a Magnetic Resonance Image MRI which is a technique of non inovasif for an analysis of the structure of the brain in the Alzheimer 39s patient.
In this research, K Means Clustering and Watershed method are used to segment the hippocampus area which is one part of the brain that was attacked by Alzheimer 39s disease. The analysis used to detect Alzheimer 39 s is comparing the value of the threshold with the number of white pixels in the images. The data used in this research are Open Access Series of Image Studies OASIS database by using the image of coronal slice. Based on the our experiment result, both K Means Clustering and Watershed method can segment the samehippocampus area to detect Alzheimers disease.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Atina
"[ABSTRAK
Intensitas keabuan yang sangat dekat memungkinkan terjadinya kesalahan dalam
menginterpretasikan citra hasil Computed Radiography (CR). Maka diperlukan
algoritma yang dapat mempermudah tim medis mendiagnosa kondisi pasien
khususnya bagian paru. Penelitian ini menggunakan tingkat keabuan /intensitas
citra sebagai dasar clustering dan segmentasi Region of Interest (ROI ) yang akan
dilakukan dengan sistem komputerisasi. Sehingga hasil pembacaan lebih akurat
dibanding secara manual. Data sampel berupa 100 citra hasil CR pasien paru
dewasa Rumah Sakit Pusat Pertamina yaitu 50 citra norma sebagai citra acuan dan
50 citra uji (normal dan abnormal). Pada clustering diuji coba dengan jumlah
cluster (k) bervariasi yaitu 3, 4, .., 10. Citra hasil clustering yang terbaik
ditunjukkan pada k = 8 karena dapat memvisualisasikan batas warna dengan lebih
jelas dibanding dengan k yang lain. Pada segmentasi ROI, citra paru dibagi
menjadi 33 daerah sesuai posisi anatomi paru yang terdiri dari 6 daerah apex, 11
daerah hilum dan 16 daerah peripheral. Selanjutnya, masing-masing daerah
pembagian diukur intensitasnya. Intensitas citra acuan dijadikan dasar untuk
menentukan abnormalitas citra uji, intensitas citra uji yang lebih tinggi dari
intensitas citra normal dikategorikan sebagai citra abnormal. Akurasi sistem pada
penelitian ini adalah 66%.

ABSTRACT
Gray intensity is very close to allow for errors in interpreting the Computed
Radiography (CR) image. It would require an algorithm that can facilitate medical
team to diagnose the patient's condition especially the lungs. Clustering k-means
clustering and segmentation Region of Interest (ROI) will be done by a
computerized system based on the image gray level / intensity. 100 CR image
used as the sample data from Rumah Sakit Pusat Pertamina, 50 image as
references images and 50 images as tested image. On clustering tested by the
number of clusters (k) varies the 3, 4, .., 10. The clustering of the best image
results are shown in k = 8 because it can visualize the color boundaries more
clearly than the other k. At ROI segmentation, lung image is divided into 33
regions corresponding anatomical position lung consist of 6 regional apex, hilum
area 11 and 16 peripheral areas. Furthermore, each regional division of the
measured intensity. The intensity of the reference image used as the basis for
determining abnormality test images, test image intensity higher than normal
image intensity categorized as abnormal image. The system accuracy in this study
was 66%., Gray intensity is very close to allow for errors in interpreting the Computed
Radiography (CR) image. It would require an algorithm that can facilitate medical
team to diagnose the patient's condition especially the lungs. Clustering k-means
clustering and segmentation Region of Interest (ROI) will be done by a
computerized system based on the image gray level / intensity. 100 CR image
used as the sample data from Rumah Sakit Pusat Pertamina, 50 image as
references images and 50 images as tested image. On clustering tested by the
number of clusters (k) varies the 3, 4, .., 10. The clustering of the best image
results are shown in k = 8 because it can visualize the color boundaries more
clearly than the other k. At ROI segmentation, lung image is divided into 33
regions corresponding anatomical position lung consist of 6 regional apex, hilum
area 11 and 16 peripheral areas. Furthermore, each regional division of the
measured intensity. The intensity of the reference image used as the basis for
determining abnormality test images, test image intensity higher than normal
image intensity categorized as abnormal image. The system accuracy in this study
was 66%.]"
2015
T43838
UI - Tesis Membership  Universitas Indonesia Library
cover
Julizar Isya Pandu Wangsa
"Pendeteksian topik merupakan suatu proses pengidentifikasian suatu tema sentral yang ada dalam kumpulan dokumen yang luas dan tidak terorganisir. Hal ini merupakan hal sederhana yang bisa dilakukan secara manual jika data yang ada hanya sedikit. Untuk data yang banyak dibutuhkan pengolahan yang tepat agar representasi topik dari setiap dokumen didapat dengan cepat dan akurat sehingga machine learning diperlukan. BERTopic adalah metode pemodelan topik yang memanfaatkan teknik clustering dengan menggunakan model pre-trained Bidirectional Encoder Representations from Transformers (BERT) untuk melakukan representasi teks dan Class based Term Frequency Invers Document Frequency (c-TF-IDF) untuk ekstraksi topik. Metode clustering yang digunakan pada penelitian ini adalah metode ­K-Means, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), dan Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN). BERT dipilih sebagai metode representasi teks pada penelitian ini karena BERT merepresentasikan suatu kalimat berdasarkan sequence-of-word dan telah memperhatikan aspek kontekstual kata tersebut dalam kalimat. Hasil representasi teks merupakan vektor numerik dengan dimensi yang besar sehingga perlu dilakukan reduksi dimensi menggunakan Uniform Manifold Approximation and Projection (UMAP) sebelum clustering dilakukan. Model BERTopic dengan tiga metode clustering ini akan dianalisis kinerjanya berdasarkan matrik nilai coherence, diversity, dan quality score. Nilai quality score merupakan perkalian dari nilai coherence dengan nilai diversity. Hasil simulasi yang didapat adalah model BERTopic menggunakan metode clustering K-Means lebih unggul 2 dari 3 dataset untuk nilai quality score dari kedua metode clustering yang ada.

Topic detection is the process of identifying a central theme in a large, unorganized collection of documents. This is a simple thing that can be done manually if there is only a small amount of data. For large amounts of data, proper processing is needed to represent the topic of each document quickly and accurately, so machine learning is required. BERTopic is a topic modeling method that utilizes clustering techniques by using pre-trained Bidirectional Encoder Representations from Transformers (BERT) models to perform text representation and Class based Term Frequency Inverse Document Frequency (c-TF-IDF) for topic extraction. The clustering methods used in this research are the K-Means, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), and Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN). BERT was chosen as the text representation method in this research because BERT represents a sentence based on sequence-of-words and has considered the contextual aspects of the word in the sentence. The result of text representation is a numeric vector with large dimensions, so it is necessary to reduce the dimensions using Uniform Manifold Approximation and Projection (UMAP) before clustering is done. The BERTopic model with three clustering methods will be analyzed for performance based on the matrix of coherence, diversity, and quality score values. The quality score value is the multiplication of the coherence value with the diversity value. The simulation results obtained are the BERTopic model using K-Means clustering method is superior to 2 of the 3 datasets for the quality score value of the two existing clustering methods."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ajeng Leudityara Fijri
"ABSTRACT
Kanker payudara adalah pertumbuhan sel-sel abnormal di jaringan pada payudara yang berkembang secara tidak terkendali. Perkembangan sel-sel abnormal secara tidak terkendali ini menyebabkan kanker menjadi salah satu penyakit paling mamatikan yang umumnya dialami oleh wanita di seluruh dunia. Salah satu cara untuk mengurangi berkembangnya sel kanker ini adalah dengan melakukan pendeteksian dini menggunakan machine learning. Beberapa metode machine learning berhasil melakukan klasifikasi kanker. Clustering merupakan salah satu metode dari machine learning yang bertujuan untuk mengelompokkan suatu dataset ke dalam subset berdasarkan ukuran jarak. Kernel Spherical K-Means (KSPKM) adalah salah satu metode clustering dengan mengganti hasil kali dalam yang ada pada Spherical K-Means (SPKM) dengan fungsi Kernel. Data kanker payudara yang digunakan pada penelitian ini adalah data kanker payudara Coimbra. Data kanker payudara Coimbra ini merupakan hasil dari pengambilan tes laboratorium yang dapat mendeteksi kanker payudara pada tubuh. Hasil klasifikasi data kanker payudara Coimbra dengan menggunakan metode SPKM memiliki hasil akurasi sebesar 81,82% dengan running time selama 0,16 detik, sensivicity sebesar 100%, dan specificity sebesar 65,62% sedangkan hasil akurasi dengan menggunakan KSPKM dengan Radial Basis Function (RBF) adalah 72,41% dengan running time 0,98 detik, sensivicity sebesar 61,54%, dan specificity sebesar 81,25% . Berdasarkan hasil akurasi pada 10% sampai 90% data yang digunakan, metode KSPKM menghasilkan akurasi yang lebih stabil dibandingkan hasil akurasi pada metode SPKM.

ABSTRACT
Breast cancer is the growth uncontrollably of abnormal cells in the tissue in the breast. The development of abnormal cells uncontrollably causes cancer to become one of the most deadly diseases commonly among women the worldwide. One way to reduce the development of cancer cells is by early detection using machine learning. Some machine learning methods successfully classify cancer. Clustering is one of the methods of machine learning that aims to grouping of a dataset into subsets based on distance measurement.. Kernel Spherical K-Means (KSPKM) is one of the clustering methods by replacing the inner products in the Spherical K-Means (SPKM) by Kernel functions. The breast cancer data used in this study were Coimbra breast cancer data. The Coimbra breast cancer data is the result of taking laboratory tests that can detect breast cancer in the body. The classification results for Coimbra breast cancer data using the SPKM method has highest accuracy 81,82% with running time for 0,16 seconds, sensivicity 100%, and specificity 65,62% while the highest accuracy results using KSPKM with Kernel radial basis function (RBF) are 72,41% with running time 0,98 seconds, sensivicity 61,54%, and specificity 81,25%. Based on the results of the accuracy of 10% to 90% of the training data used, the KSPKM method produces more stable accuracy than the accuracy results of SPKM method."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Khoirul Umam
"DNA adalah salah satu pembawa informasi genetik pada makhluk hidup. Sequencing dan clustering barisan DNA telah menjadi pekerjaan utama dan rutin dalam dunia biologi molekuler, khususnya dalam bidang terapan bioinformatika. Secara umum metode clustering dapat dibedakan menjadi dua, yaitu hirarki clustering dan partisi clustering. Penelitian ini menggabungkan dua metode clustering yaitu K-Means partisi clustering pada Level 1 dan DIANA hirarki clustering pada Level 2, oleh karena itu disebut Two-Level Hybrid Clustering. Proses awal dimulai dengan mengumpulkan barisan DNA HPV yang diperoleh dari NCBI National Centre for Biotechnology Information, Ekstraksi Ciri, dan Normalisasi. Kemudian melakukan proses clustering menggunakan algoritma K-Means pada Level 1 dan algoritma DIANA pada Level 2. Untuk menghitung jarak genetik antar barisan DNA HPV digunakan persamaan Euclidian Distance. Dan validitas klaster yang digunakan untuk menentukan banyaknya klaster yang optimum adalah Indeks Davies-Bouldin IDB. Hasil penerapan Two-Level Hybrid Clustering pada 1252 barisan DNA HPV adalah data dikelompokan menjadi 4 klaster dengan nilai IDB yaitu 0.859154564. Semua perhitungan dan proses clustering menggunakan software R.

DNA is one of the carrier of genetic information in living organisms. Sequencing and clustering DNA sequences has become the key and routine activitis in the molecular biology, in particular on bioinformatics applications. There are two type of clustering, hierarchical clustering and partitioning clustering. In this paper, we combine two type clustering proccesses including K Means partitioning clustering on Level 1 and DIANA hierarchical clustering on Level 2, therefore it called Two Level Hybrid clustering. The beginning of process is started with collecting DNA sequences of HPV from NCBI National Centre for Biotechnology Information, Characteristics Extraction, and Normalization. The next step is clustering by implementation K Means algorithm on Level 1 and DIANA algorithm on Level 2. To calculate the genetic distance we use Euclidian Distance. Moreover, in validating cluster results in order to get optimum number of clusters, we use Davies Bouldin Index DBI. The result of implementation of Two Level Hybrid Clustering on 1252 sequences of HPV is the data clustered into 4 clusters with minimal IDB value is 0.859154564. All calculating and clustering process in this paper using software R.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47109
UI - Tesis Membership  Universitas Indonesia Library
cover
Nathasya Eliora Kristianti
"Citra hyperspectral merupakan citra yang menyimpan informasi spektrum elektromagnetik dengan jangkauan panjang gelombang tertentu secara kontinu untuk tiap pikselnya. Citra hyperspectral ini lebih kaya informasi dibanding citra RGB biasanya yang hanya menyimpan informasi dari warna merah, hijau, dan biru. Oleh karena itu, citra hyperspectral banyak digunakan di berbagai bidang, salah satunya untuk analisis tinta pada forensik dokumen. Dalam beberapa kasus, tinta yang berbeda distribusi spektranya dapat terlihat sama di mata manusia di bawah sumber cahaya tertentu. Fenomena ini disebut metamerism. Akan tetapi, tinta yang terlihat sama ini tidaklah sama dalam representasi hyperspectral. Penelitian ini bertujuan untuk mendapatkan representasi terbaik citra hyperspectral dengan menggunakan reduksi dimensi PCA dan t-SNE untuk melakukan pengelompokan K-means. Didapatkan hasil bahwa metode t-SNE merupakan hasil terbaik dalam beberapa eksperimen yang dilakukan dengan rata-rata precision 0.782 dan rata-rata recall 0,783. Diharapkan hasil penelitian ini dapat bermanfaat di bidang analisis dokumen

Hyperspectral images are images that store electromagnetic spectrum information with a certain range continuously for each pixel. These hyperspectral images contain a lot more information compared to the more common RGB image that only has red, blue, and green bands. Thus, hyperspectral images can be used in various applications, such as for ink analysis in document forensics. In some cases, inks with different spectral distribution may appear similar to the human eye due to metamerism. However, these similar looking inks are not similar in their hyperspectral representation. This research aims to obtain the best representation for hyperspectral images by using PCA and t-SNE dimensionality reduction to perform K-means clustering. From the results, we found that the t-SNE dimensionality reduction techniques gives the best result with average precision of 0,782 and average recall of 0,783. Hopefully this research can be useful for future works in document analysis.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Atika Previanti Nabila
"Segmentasi dalam dunia medis sudah menjadi suatu hal yang penting untuk menentukan diagnosa awal dari suatu penyakit, misalnya timbulnya tumor pada organ-organ tubuh yang berukuran kecil dan sulit teramati oleh mata telanjang. Namun, jika segmentasi dilakukan secara manual dan tradisional akan membutuhkan waktu yang banyak serta menyebabkan hasil yang tidak konsisten. Oleh karena itu, dibutuhkannya segmentasi secara otomatis yang dapat membantu dokter tidak hanya dalam mengetahui keberadaan tumor, melainkan juga dapat mengkuantifikasi ukuran tumor. Dalam penelitian ini, segmentasi otomatis dengan machine learning diterapkan menggunakan metode clustering K-Means pada fantom ekuivalen hati berbentuk silinder. Fantom ekuivalen terbuat dari material tepung beras dan lilin, yang kemudian diinjeksikan dengan radioaktivitas 18F-FDG sebesar 1,89 µCi/mL. Pengolahan citra fantom dilakukan dengan pesawat PET/CT Siemens Biograph menggunakan metode rekonstruksi Iterative 3D dan True-X serta 2 filter (Gaussian dan Butterworth). Akurasi deteksi algoritma K-Means menunjukkan bahwa dapat optimal pada tiga tipe pemindaian dengan terdeteksinya seluruh objek pada citra fantom. Namun, hal tersebut terkecualikan pada filter Gaussian dengan metode rekonstruksi Iterative 3D karena algoritma K-Means tidak dapat mendeteksi objek terkecil (4 mm) pada kedua wilayah fantom. Indikasi tidak terdeteksinya objek terkecil, dapat disebabkan oleh kinerja algoritma yang mengelompokkan objek dengan nilai piksel yang sama. Untuk hasil kuantifikasi diameter dengan algoritma K-Means (Dp) menunjukkan bahwa, hasil ukuran diameter lebih besar ±1-3 mm dibandingkan diameter fisis fantom (Dt) pada ketiga pemindaian. Namun, hal tersebut tidak berlaku pada pemindaian filter Gaussian dengan metode rekonstruksi Iterative 3D, yang memiliki kuantifikasi lebih kecil dibandingkan . Berdasarkan hasill kuantifikasi pada keempat pemindaian, ditunjukkan bahwa algoritma K-Means optimal pada filter Butterworth dengan metode rekonstruksi True-X dengan rata-rata RD untuk seluruh objek kurang dari 10%. Sehingga, untuk memvalidasi hal tersebut metode pengukuran K-Means dibandingkan dengan metode pengukuran FWHM dan FWTM dengan merata-ratakan kuantifikasi untuk setiap objek dari semua irisan. Tervalidasi bahwa algoritma K-Means memiliki performa yang optimal, dengan anilai RD yang dihasilkan hampir mendekati 0%.

Segmentation in medical, has become an important thing to determine the initial diagnosis of a desease, for example the emergence of tumors in organs that are small and difficult to observe manually. However, if the segmentation in medical is done manually and traditionally it will take a lot of time and cause inconsistant results. Therefore, automatic segmentation is needed which can help doctors not only by knowing the presence of tumors, but also in quantifying tumor size. In this study, automatic segmentation with machine learning was applied using the K-Means clustering algorithm method on the cylindrical liver equivalent phantom. The equivalent phantom was made from rice flour and wax, and the euqivalent phantom was injected with 18F-FDG with radioactivity 1,89 µCi/mL. The image processing was carried put using a PET/CT Siemens Biograph with Iterative 3D and True-X as reconstuction methods and 2 filters (Gaussian and Butterworth). The detection accuracy of the K-Means algorithm shows that it can be optimal in three types of scanning by detecting all objects in the phantom image. However, this is ecluded in the Gaussian filter with Iterative 3D reconstruction method, because the K-Means algorthm cannot detect the smallest object (4 mm) in both phantom regions. Indications for that phenomenon, could be caused by the performance of the algorithm that grouping the cluster with the same pixel value. For diameter quantifications of from K-Means algorithm shows that the diameter ±1-3 mm larger than the pyhsical fantom diameter (Dt). Based on the result of Dp quantification on the for type of scans, it it shown that the optimal K-Means algorithm on the Butterworth filter with the True-X reconstruction method with an average RD for all objects in phantom is less than 10%. So, to validate this result, the K-Means measurement method is compared with the FWHM and FWTM measurements methods by averaging the quantification for each object from all slices. It is validated that, the K-Means algorthm has optimal performance by reffering to the FWTM measurement where RD value is close to 0%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Frisca
"Spectral clustering adalah salah satu algoritma clustering modern yang paling terkenal. Sebagai teknik clustering yang efektif, metode spectral clustering muncul dari konsep teori graf spektral. Metode spectral clustering membutuhkan algoritma partisi. Ada beberapa metode partisi termasuk PAM, SOM, Fuzzy c-means, dan k-means. Berdasarkan penelitian yang telah dilakukan oleh Capital dan Choudhury pada 2013, ketika menggunakan Euclidian distance, k-means memberikan akurasi yang lebih baik dibandingkan dengan algoritma PAM. sehingga, makalah ini menggunakan algoritma k-means. Keuntungan utama dari spectral clustering adalah mengurangi dimensi data, terutama dalam hal ini untuk mengurangi dimensi yang besar dari data microarray.
Microarray data adalah chip berukuran kecil yang terbuat dari slide kaca yang berisi ribuan bahkan puluhan ribu jenis gen dalam fragmen DNA yang berasal dari cDNA. Aplikasi data microarray secara luas digunakan untuk mendeteksi kanker, misalnya adalah karsinoma, di mana sel-sel kanker mengekspresikan kelainan pada gen-nya. Proses spectral clustering dimulai dengan pengumpulan data microarray gen karsinoma, preprocessing, menghitung similaritas, menghitung , menghitung nilai eigen dari , membentuk matriks , dan clustering dengan menggunakan k-means. Dari hasil pengelompokan gen karsinoma pada penelitian ini diperoleh dua kelompok dengan nilai rata-rata Silhouette maksimal adalah 0.6336247. Proses clustering pada penelitian ini menggunakan program open source R.

Spectral clustering is one of the most famous modern clustering algorithms. As an effective clustering technique, spectral clustering method emerged from the concepts of spectral graph theory. Spectral clustering method needs partitioning algorithm. There are some partitioning methods including PAM, SOM, Fuzzy c means, and k means. Based on the research that has been done by Capital and Choudhury in 2013, when using Euclidian distance k means algorithm provide better accuracy than PAM algorithm. So in this paper we use k means as our partition algorithm. The major advantage of spectral clustering is in reducing data dimension, especially in this case to reduce the dimension of large microarray dataset.
Microarray data is a small sized chip made of a glass plate containing thousands and even tens of thousands kinds of genes in the DNA fragments derived from doubling cDNA. Application of microarray data is widely used to detect cancer, for the example is carcinoma, in which cancer cells express the abnormalities in his genes. The spectral clustering process is started with collecting microarray data of carcinoma genes, preprocessing, compute similarity matrix, compute , compute eigen value of , compute , clustering using k means algorithm. In this research, Carcinoma microarray data using 7457 genes. The result of partitioning using k means algorithm is two clusters clusters with maximum Silhouette value 0.6336247.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47117
UI - Tesis Membership  Universitas Indonesia Library
cover
Wu, Junjie
"This book addresses these challenges and makes novel contributions in establishing theoretical frameworks for K-means distances and K-means based consensus clustering, identifying the "dangerous" uniform effect and zero-value dilemma of K-means, adapting right measures for cluster validity, and integrating K-means with SVMs for rare class analysis. This book not only enriches the clustering and optimization theories, but also provides good guidance for the practical use of K-means, especially for important tasks such as network intrusion detection and credit fraud prediction. The thesis on which this book is based has won the "2010 National Excellent Doctoral Dissertation Award", the highest honor for not more than 100 PhD theses per year in China."
Berlin: Springer-Verlag, 2012
e204063793
eBooks  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>