Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 147844 dokumen yang sesuai dengan query
cover
Nidaul Muiz Aufa
"Tesis ini membahas penyebaran malware Avalanche pada infrastruktur internet Indonesia. Penelitian dilakukan dengan metode analisis big data dengan menggunakan Algoritma K-mean (k=3). Dataset pada penelitian ini menggunakan dataset yang diperoleh dari CERT-bund. Hasil penelitian ini menggambarkan bahwa infrastruktur internet Indonesia masih terinfeksi malware Avalanche dengan aktivitas sebanyak 44.254.374 sepanjang tahun 2018 dan 2019. Aktivitas ini melibatkan 969 AS Number, 3.173.254 IP Address, dan 26 jenis malware. Hasil Clustering menggunakan Splunk terhadap AS Number dan IP Address menghasilkan masing-masing 3 cluster. Cluster AS Number yang paling produktif
adalah cluster1 yang memiliki populasi 3 AS Number. Sedangkan Cluster IP Address yang paling produktif adalah cluster1 dengan populasi 32.991 IP Address.

This thesis discusses the spread of Avalanche malware on Indonesian internet infrastructure. The research was conducted by using the big data analysis method using the K-mean algorithm (k = 3). The dataset in this study was obtained from the CERT-bund. The results of this study illustrate that Indonesia's cyber infrastructure is still infected with Avalanche malware with a total of 44,254,374 activities throughout 2018 and 2019. This activity involved 969 AS Numbers, 3,173,254 IP Addresses, and 26 types of malware. The results of clustering using Splunk on the AS Number and IP Address resulted in 3 clusters each. The most productive AS Number cluster is cluster1 which has a population of 3 AS Number. Meanwhile, the most productive cluster IP address is cluster1 with a population of 32,991 IP addresses."
Jakarta: Fakultas Kedokteran Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Eka Kurnia Sari
"Perkembangan sistem teknologi telekomunikasi yang semakin canggih dan kompleks memicu meningkatnya kegagalan ataupun kesalahan sistem dalam sistem jaringan utama dan sistem pendukung layanan telekomunikasi, serta kesalahan yang terjadi pada bisnis proses dan sumber daya manusia yang terkait. Kegagalan dan kesalahan ini menyembabkan kerugian yang ditanggung perusahaan, kerugian yang ditimbulkan dengan istilah revenue leakage atau kebocoran pendapatan. Revenue Assurance memegang peranan penting dalam pengendalian terhadap resiko revenue leakage dengan membuat kontrol dalam mendeteksi dan mencegah terjadinya kebocoran agar mampu meminimalkan biaya dan memaksimalkan potensi pendapatan. Dalam tesis ini dikembangkan metode untuk menganalisis Big data CDR untuk mengoptimalkan proses analisis pada revenue assurance control dengan menggunakan algoritma K-means Clustering. Algortima ini mengelompokkan obyek pengamatan dalam beberapa kategori yang diindikasikan sebagai titik kebocoran. Hasil kelompok yang dihasilkan dengan kategori yang beresiko tinggi memiliki anggota yang sedikit dengan tingkat nilai evaluasi akurasi cluster, R-Squared, sekitar 90%.

In the telco industry, Revenue Assurance plays an important role to assure the company revenue from leakage. the revenue chain is established across the process and whole sophisticated system that technologically complex to provide the unstoppable services. This case increasing the probability of system or process failure leads to the leakage. Hence necessary the revenue assurance control to detect and prevent it then it can help to minimize cost and maximize revenue. In this thesis, developed the analysis method in big data CDR to optimize analysis process at revenue assurance control using K-means Clustering algorithm. The use of the K-means clustering algorithm method able to group the object areas with high risk indications of leakage. The cluster result of high risk of leakage is having low amount of member, and the cluster evaluation result of R-Squared giving the good value about 90%."
Depok: Fakultas Teknik Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Bambang Novianto
"Pertumbuhan pemanfaatan internet telah meningkatkan perhatian terhadap keamanan data. Pada tahun 2014, Projek SHINE (SHodan Intelligence Extraction) telah menerbitkan laporan penilaian keamanan skala besar untuk perangkat yang terhubung ke Internet. Namun, berdasarkan laporan tersebut, jumlah informasi mengenai IP address Indonesia yang berhasil didapatkan masih sedikit. Terdapat sebanyak 7.182 IP address dari Indonesia, yaitu sekitar 0,0032% dari total 2.186.971 IP address yang berhasil dikumpulkan oleh Projek SHINE. Dalam penulisan tesis ini, penulis mengajukan inisiatif untuk melakukan analisis kerentanan semua informasi Autonomous System Number (AS Number) di Indonesia dari Shodan. Penulis telah menyusun dataset semua informasi AS Number di Indonesia antara lain 12.787 port, 79 sistem operasi, 409 produk, 3.634 domain, 145.543 IP address, dan 790 organisasi. Penulis menggunakan algoritma K-Means clustering untuk mengelompokkan AS Number ke dalam beberapa kelas sesuai dengan tingkat paparan di shodan. Berdasarkan hasil pengelompokan, penulis mendapatkan 4 kelas AS Number antara lain 1.075 AS Number di kelas: 0 (belum terdapat informasi mengenai AS Number tersebut di Shodan), 614 AS Number di kelas: 1 (tingkat paparan rendah), 9 AS Number di kelas: 2 (tingkat paparan sedang), dan 1 AS Number di kelas: 3 (tingkat paparan tinggi). Informasi ini dapat dimanfaatkan oleh Kementerian yang menangani bidang Teknologi Informasi dan Komunikasi dan Badan yang menangani Keamanan Siber di Indonesia untuk menghimbau organisasi pengelola AS Number agar mewaspadai potensi kerentanan yang dinformasikan oleh Shodan dan dimanfaatkan oleh hacker.

The growth of internet-enabled devices has increased interest in cybersecurity. In 2014, Project SHINE (SHodan INtelligence Extraction) published a report of large-scale security assessments for devices connected to the Internet. However, the number of IP addresses harvested from Indonesia in 2014 is very small. There were 7.182 IP address from Indonesia. It was about 0,0032% from the total 2.186.971 IP addresses. In this paper, we propose an initiative to gather all information for all Autonomous System Number (AS Number) from Indonesia in Shodan. We have gathered a dataset about all information of AS Numbers in Indonesia such as 12.787 unique ports, 79 unique operating systems, 409 unique products, 3.634 unique domains, 145.543 unique IP addresses, and 790 unique organizations. We use the K-Means algorithm to cluster all AS Numbers into several classes according to the exposure level in shodan. Based on the result, we have 4 classes of AS Numbers. There are 1.075 AS Numbers in class:0 (no information in Shodan yet), 614 AS Numbers in class:1 (exposure level = low), 9 AS Numbers in class:2 (exposure level = medium), and 1 AS Number in class:3 (exposure level = high). This information can be used to warn the organizations that manage AS Numbers in Indonesia to be aware of the security and the threats to their systems."
Jakarta: Fakultas Teknik Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Dendy Tryanda
"Produk internet fixed broadband atau produk internet menggunakan kabel merupakan produk yang jarang digunakan oleh masyarakat Indonesia, padahal di era Covid-19 dengan sistem work from home, masyarakat membutuhkan kualitas internet yang baik. Penelitian ini bertujuan untuk membantu PT ABC mendapatkan pelanggan baru dengan melakukan cross-selling produk terhadap pelanggan dari anak perusahaannya yaitu PT XYZ yang juga menggunakan produk internet fixed broadband namun bukan produk dari PT ABC dengan menggunakan metode machine learning jenis unsupervised learning dengan jenis clustering partisi dengan algoritma k-means clustering dengan menggunakan tool KNIME untuk proses k-means clustering dan tool R Programming untuk proses pencarian cluster jumlah optimal. Hasil dari algoritma ini menemukan bahwa terdapat empat jenis cluster pelanggan PT XYZ yang karakteristiknya dapat dilihat dari sisi pendapatan yang didapat dari hasil korelasi data, cluster 2 dan cluster 3 merupakan cluster potensial dengan 2123 pelanggan dan area yang memiliki sedikit pelanggan adalah area 1 dan area 4, lalu estimasi pendapatan minimum yang akan dihasilkan adalah Rp 8.937.830.000.

Internet fixed broadband products or internet products using cables is a products that are rarely used by Indonesian people, even though in the Covid-19 era with a work from home system, people need a good quality internet. This study aims to help PT ABC get new customers by cross-selling products to customers of its subsidiary PT XYZ who also use internet fixed broadband products, but not products from PT ABC by using the machine learning method unsupervised learning types with partition clustering and the k-means clustering algorithm using the KNIME tool for the k-means clustering process and the R Programming tool for the process of finding the optimal number of clusters. The result of this algorithm finds that there are four types of PT XYZ customer clusters whose characteristics we can see from the revenue side from the results of data correlation, cluster 2 and cluster 3 are potential clusters with 2123 customers and areas that have few customers are area 1 and area 4, then the estimated minimum revenue that will be generated is IDR 8,937,830,000."
Jakarta: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Frisca
"Spectral clustering adalah salah satu algoritma clustering modern yang paling terkenal. Sebagai teknik clustering yang efektif, metode spectral clustering muncul dari konsep teori graf spektral. Metode spectral clustering membutuhkan algoritma partisi. Ada beberapa metode partisi termasuk PAM, SOM, Fuzzy c-means, dan k-means. Berdasarkan penelitian yang telah dilakukan oleh Capital dan Choudhury pada 2013, ketika menggunakan Euclidian distance, k-means memberikan akurasi yang lebih baik dibandingkan dengan algoritma PAM. sehingga, makalah ini menggunakan algoritma k-means. Keuntungan utama dari spectral clustering adalah mengurangi dimensi data, terutama dalam hal ini untuk mengurangi dimensi yang besar dari data microarray.
Microarray data adalah chip berukuran kecil yang terbuat dari slide kaca yang berisi ribuan bahkan puluhan ribu jenis gen dalam fragmen DNA yang berasal dari cDNA. Aplikasi data microarray secara luas digunakan untuk mendeteksi kanker, misalnya adalah karsinoma, di mana sel-sel kanker mengekspresikan kelainan pada gen-nya. Proses spectral clustering dimulai dengan pengumpulan data microarray gen karsinoma, preprocessing, menghitung similaritas, menghitung , menghitung nilai eigen dari , membentuk matriks , dan clustering dengan menggunakan k-means. Dari hasil pengelompokan gen karsinoma pada penelitian ini diperoleh dua kelompok dengan nilai rata-rata Silhouette maksimal adalah 0.6336247. Proses clustering pada penelitian ini menggunakan program open source R.

Spectral clustering is one of the most famous modern clustering algorithms. As an effective clustering technique, spectral clustering method emerged from the concepts of spectral graph theory. Spectral clustering method needs partitioning algorithm. There are some partitioning methods including PAM, SOM, Fuzzy c means, and k means. Based on the research that has been done by Capital and Choudhury in 2013, when using Euclidian distance k means algorithm provide better accuracy than PAM algorithm. So in this paper we use k means as our partition algorithm. The major advantage of spectral clustering is in reducing data dimension, especially in this case to reduce the dimension of large microarray dataset.
Microarray data is a small sized chip made of a glass plate containing thousands and even tens of thousands kinds of genes in the DNA fragments derived from doubling cDNA. Application of microarray data is widely used to detect cancer, for the example is carcinoma, in which cancer cells express the abnormalities in his genes. The spectral clustering process is started with collecting microarray data of carcinoma genes, preprocessing, compute similarity matrix, compute , compute eigen value of , compute , clustering using k means algorithm. In this research, Carcinoma microarray data using 7457 genes. The result of partitioning using k means algorithm is two clusters clusters with maximum Silhouette value 0.6336247.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47117
UI - Tesis Membership  Universitas Indonesia Library
cover
Naiza Astri Wulandari
"Sistem Penilaian Esai Otomatis (Simple-O) telah dibuat menggunakan algoritma K-Means dan metode Latent Semantic Analysis (LSA). Jawaban karangan siswa pertama-tama akan diklasifikasikan ke dalam kelas-kelas sesuai dengan topik masing-masing nomor, dan akan memisahkannya dari jawaban siswa yang tidak sesuai konteks kemudian akan dilakukan proses LSA yang merepresentasikan kata ke dalam matriks, yang kemudian matriks direduksi menggunakan Singular Value Decomposition dan dilanjutkan dengan mencari norma frobenius yang merupakan nilai dari setiap soal. Pada penelitian ini dilakukan uji coba dengan menggunakan 4 skenario dan hasil penelitian SIMPLE-O menggunakan algoritma K-Means dan LSA menghasilkan akurasi rata-rata sebesar 74% yaitu hasil skenario pengujian 1

An Automatic Essay Assessment System (Simple-O) has been created using the K-Means algorithm and the Latent Semantic Analysis (LSA) method. Students' essay answers will first be classified into classes according to the topic of each number, and will separate them from student answers that do not fit the context then an LSA process will be carried out which represents the word into a matrix, which is then reduced by using Singular Value. Decomposition and continue by looking for the Frobenius norm which is the value of each question. In this study, trials were carried out using 4 scenarios and the results of the SIMPLE-O research using the K-Means and LSA algorithms produced an average accuracy of 74%, namely the results of the test scenario number 1."
Depok: FAkultas Teknik Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Wu, Junjie
"This book addresses these challenges and makes novel contributions in establishing theoretical frameworks for K-means distances and K-means based consensus clustering, identifying the "dangerous" uniform effect and zero-value dilemma of K-means, adapting right measures for cluster validity, and integrating K-means with SVMs for rare class analysis. This book not only enriches the clustering and optimization theories, but also provides good guidance for the practical use of K-means, especially for important tasks such as network intrusion detection and credit fraud prediction. The thesis on which this book is based has won the "2010 National Excellent Doctoral Dissertation Award", the highest honor for not more than 100 PhD theses per year in China."
Berlin: Springer-Verlag, 2012
e204063793
eBooks  Universitas Indonesia Library
cover
Sofia Debi Puspa
"Penelitian ini bertujuan untuk mengimplementasikan similarity based biclustering SBB dalam memperoleh bicluster sekumpulan gen dengan ekspresi yang similar di bawah kondisi tertentu yang signifikan pada data microarray. Secara teoritis similarity based biclustering terdiri atas tiga tahap utama, yaitu: membangun matriks similaritas baris gen dan matriks similaritas kolom kondisi , mempartisi masing-masing matriks similaritas dengan hard clustering khususnya dalam penelitian ini menggunakan partisi k-means, dan ekstrak bicluster. Sebelum mengimplementasikan metode SBB, strategi seleksi gen diterapkan dan selanjutnya dilakukan normalisasi. Perolehan evaluasi indeks silhouette pada dataset diabetic nephropathy, diabetic retinopathy dan lymphoma berturut-turut pada cluster kondisi yaitu 0,8304; 0,7853 dan 0,7382, sedangkan indeks silhouette untuk cluster gen yaitu 0,5382; 0,5408 dan 0,5464. Dan dari hasil analisis cluster kondisi, akurasi dari dataset diabetic nephropathy dan diabetic retinopathy yaitu 100 , sedangkan dataset lymphoma yaitu 98 . Selanjutnya dapat diketahui regulasi proses seluler yang terjadi pada bicluster dari ketiga dataset. Hasil analisis menunjukkan bahwa gen-gen yang diperoleh dari bicluster sesuai dengan fungsi gen dan proses biologis didukung oleh GO enrichment sehingga menjadi potensi yang besar bagi praktisi medis dalam tindak lanjut suatu penyakit yang diderita oleh pasien.

This study aims to implement similarity based biclustering SBB in obtaining a bicluster a set of genes that exhibit similar levels of gene expression under certain conditions that is significant in microarray data. Theoretically, similarity based biclustering consists of three main phase constructing the row gene similarity matrix and the column condition similarity matrix, partitioning each matrix similarity with hard clustering especially in this research using k means partition, and extracting bicluster. Before implementing the SBB method, the gene selection strategy is applied and subsequently normalized. The acquisition of silhouette index evaluation in diabetic nephropathy, diabetic retinopathy, and lymphoma on cluster condition respectively is 0.8304, 0.7853 and 0.7382, while the silhouette index for the gene cluster is 0.5382, 0.5408 and 0.5464. In addition, according to the cluster condition analysis, accuracy of dataset diabetic nephropathy and diabetic retinopathy is 100 , whereas dataset lymphoma is 98 . Furthermore, it can be known cellular regulation that occurs on the bicluster of the three datasets. The results of the analysis show that the genes obtained from bicluster are relevant to the function of genes and biological processes supported by GO enrichment , therefore it becomes a great potential for medical practitioners in the follow up of a disease suffered by the patient.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49530
UI - Tesis Membership  Universitas Indonesia Library
cover
Pratiwi Arizona
"Online customers segmentation could be a valuable research topic of marketing strategy. Previous literature mainly studied the differences between non-purchasers and purchasers, lacking further segmentation of online customers themselves. This thesis focuses on online customer segmentation based on a large volume of real transaction data in one of Indonesias e-commerce website. This research proposes a customer clustering technique using the K-Means algorithm and RFM Patterns as an analysis of the customers profile. Then, the market basket analysis is conducted using the Apriori algorithm for every customer profile and cluster to obtain the association rule as well as product relationships purchased by customers. Later on, the result of market basket analysis is utilized as an input for e-commerce companies in designing promotions such as bundling or product recommendation system for segmented customers.

Segmentasi pelanggan daring bisa menjadi topik penelitian yang berharga dalam strategi pemasaran. Literatur yang sudah ada cenderung mempelajari perbedaan antara pembeli dan non-pembeli, tanpa menggali lebih lanjut mengenai segmentasi pelanggan daring itu sendiri. Tesis ini berfokus pada segmentasi pelanggan daring berdasarkan data transaksi di salah satu situs penjualan daring di Indonesia. Penelitian ini mengusulkan teknik pengelompokan pelanggan menggunakan algoritma K-Means dan pola RFM sebagai analisis profil pelanggan. Kemudian, analisis keranjang belanja dilakukan dengan menggunakan algoritma Apriori untuk setiap profil pelanggan dan kluster untuk mendapatkan aturan asosiasi serta hubungan produk yang dibeli oleh pelanggan. Kemudian, hasil analisis keranjang belanja tersebut digunakan sebagai masukan untuk perusahaan penjualan daring dalam merancang promosi seperti bundling atau sistem rekomendasi produk untuk pelanggan yang berada dalam profil yang sama."
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2019
T53471
UI - Tesis Membership  Universitas Indonesia Library
cover
Jihan
"ABSTRAK
Multiple Travelling Salesman Problem (M-TSP) adalah masalah pencarian rute perjalanan optimal dari n kota oleh m salesman dengan m < n, dengan tiap kota hanya dapat dikunjungi satu kali dan oleh satu orang salesman saja. M-TSP merupakan perkembangan dari TSP dengan salesman lebih dari satu. Dalam tugas akhir ini akan dibahas M-TSP Single Depot yaitu M-TSP dengan kota awal perjalanan semua salesman berada di kota yang sama. Untuk menyelesaikan M-TSP digunakan Algoritma K-Means Clustering-Genetika, yaitu dengan membagi n kota yang ada menjadi m kluster kemudian tiap kluster akan diterapkan algoritma genetika dan pada akhirnya seluruh hasil yang didapat akan dijumlahkan untuk mengetahui total jarak tempuh seluruh salesman.

ABSTRACT
Multiple Travelling Salesman Problem (M-TSP) is a problem of finding an optimal travel route from n cities by m salesmen with m < n, the condition is that each city can only be visited once and only by one salesman. M-TSP is a development of the TSP problem which involves more than one salesman. M-TSP Single Depot, where all the salesmen start travelling from the same city, will be discussed in this final project. M-TSP will be solved by using the K-Means Clustering-Genetic Algorithm that divides n cities to m clusters and applies the genetic algorithm to each cluster, then all the results obtained will be summed to determine the total mileage of the whole salesman."
2015
S59601
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>