Hasil Pencarian

Ditemukan 92 dokumen yang sesuai dengan query

Loshin, David, 1963-

Big data analytics : from strategic planning to enterprise integration with tools, techniques, NoSQL, and graph

ABSTRACT

Big Data Analytics" will assist managers in providing an overview of the drivers for introducing big data technology into the organization and for understanding the types of business problems best suited to big data analytics solutions, understanding the value drivers and benefits, strategic planning, developing a pilot, and eventually planning to integrate back into production within the enterprise.

Amsterdam: Morgan Kaufmann, 2013

658.472 LOS b

Buku Teks SO Universitas Indonesia Library

Ishmah Naqiyya

Perlindungan privasi dan data pribadi dalam big data analytics = Privacy and personal data protection in big data analytics.

"Perkembangan teknologi informasi dan internet dalam berbagai sektor kehidupan menyebabkan terjadinya peningkatan pertumbuhan data di dunia. Pertumbuhan data yang berjumlah besar ini memunculkan istilah baru yaitu Big Data. Karakteristik yang membedakan Big Data dengan data konvensional biasa adalah bahwa Big Data memiliki karakteristik volume, velocity, variety, value, dan veracity. Kehadiran Big Data dimanfaatkan oleh berbagai pihak melalui Big Data Analytics, contohnya Pelaku Usaha untuk meningkatkan kegiatan usahanya dalam hal memberikan insight yang lebih luas dan dalam. Namun potensi yang diberikan oleh Big Data ini juga memiliki risiko penggunaan yaitu pelanggaran privasi dan data pribadi seseorang. Risiko ini tercermin dari kasus penyalahgunaan data pribadi Pengguna Facebook oleh Cambridge Analytica yang berkaitan dengan 87 juta data Pengguna. Oleh karena itu perlu diketahui ketentuan perlindungan privasi dan data pribadi di Indonesia dan yang diatur dalam General Data Protection Regulation (GDPR) dan diaplikasikan dalam Big Data Analytics, serta penyelesaian kasus Cambridge Analytica-Facebook. Penelitian ini menggunakan metode yuridis normatif yang bersumber dari studi kepustakaan. Dalam Penelitian ini ditemukan bahwa perlindungan privasi dan data pribadi di Indonesia masih bersifat parsial dan sektoral berbeda dengan GDPR yang telah mengatur secara khusus dalam satu ketentuan. Big Data Analytics juga memiliki beberapa implikasi dengan prinsip perlindungan privasi dan data pribadi yang berlaku. Indonesia disarankan untuk segera mengesahkan ketentuan perlindungan privasi dan data pribadi khusus yang sampai saat ini masih berupa rancangan undang-undang.

The development of information technology and the internet in various sectors of life has led to an increase in data growth in the world. This huge amount of data growth gave rise to a new term, Big Data. The characteristic that distinguishes Big Data from conventional data is that Big Data has the characteristic of volume, velocity, variety, value, and veracity. The presence of Big Data is utilized by various parties through Big Data Analytics, for example for Corporation to incurease their business activities in terms of providing broader and deeper insight. But this potential provided by Big Data also comes with risks, which is violation of one's privacy and personal data. One of the most scandalous case of abuse of personal data is Cambridge Analytica-Facebook relating to 87 millions user data. Therefor it is necessary to know the provisions of privacy and personal data protection in Indonesia and which are regulated in the General Data Protection (GDPR) and how it applied in Big Data Analytics, as well as the settlement of the Cambridge Analytica-Facebook case. This study uses normative juridical methods sourced from library studies. In this study, it was found that the protection of privacy and personal data in Indonesia is still partial and sectoral which is different from GDPR that has specifically regulated in one bill. Big Data Analytics also has several implications with applicable privacy and personal data protection principles. Indonesia is advised to immediately ratify the provisions on protection of privacy and personal data which is now is still in the form of a RUU."

Depok: Fakultas Hukum Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Febtriany

Prediksi customer churn industri telekomunikasi menggunakan teknologi big data = Predicting customer churn in telco industry using big data technology

"Saat ini kompetisi di industri telekomunikasi semakin ketat. Perusahaan telekomunikasi yang dapat tetap menghasilkan banyak keuntungan yaitu perusahaan yang mampu menarik dan mempertahankan pelanggan di pasar yang sangat kompetitif dan semakin jenuh. Hal ini menyebabkan perubahan strategi banyak perusahaan telekomunikasi dari strategi 'growth '(ekspansi) menjadi 'value added services'. Oleh karena itu, program mempertahankan pelanggan ('customer retention') saat ini menjadi bagian penting dari strategi perusahaan telekomunikasi. Program tersebut diharapkan dapat menekan 'churn' 'rate 'atau tingkat perpindahan pelanggan ke layanan/produk yang disediakan oleh perusahaan kompetitor.

Program mempertahankan pelanggan ('customer retention') tersebut tentunya juga diimplementasikan oleh PT Telekomunikasi Indonesia, Tbk (Telkom) sebagai perusahaan telekomunikasi terbesar di Indonesia. Program tersebut diterapkan pada berbagai produk Telkom, salah satunya Indihome yang merupakan 'home services' berbasis 'subscriber' berupa layanan internet, telepon, dan TV interaktif. Melalui kajian ini, penulis akan menganalisa penyebab 'churn' pelanggan potensial produk Indihome tersebut, sehingga Telkom dapat meminimalisir angka 'churn' dengan melakukan program 'customer retention' melalui 'caring' yang tepat.

Mengingat ukuran 'database' pelanggan Indihome yang sangat besar, penulis akan menganalisis data pelanggan tersebut menggunakan metoda 'Big Data Analytics'. 'Big Data' merupakan salah satu metode pengelolaan data yang sangat besar dengan pemetaan dan 'processing' data. Melalui berbagai bentuk 'output', implementasi 'big data' pada perusahaan akan memberikan 'value' yang lebih baik dalam pengambilan keputusan berbasis data.

Nowadays, telecommunication industry is very competitive. Telecommunication companies that can make a lot of profit is the one who can attract and retain customers in this highly competitive and increasingly saturated market. This causes change of the strategy of telecommunication companies from growth strategy toward value added services. Therefore, customer retention program is becoming very important in telecommunication companies strategy. This program hopefully can reduce churn rate or loss of potential customers due to the shift of customers to other similar products.
Customer retention program also implemented by PT Telekomunikasi Indonesia, Tbk (Telkom) as the leading telecommunication company in Indonesia. Customer retention program implemented for many Telkom products, including Indihome, a home services based on subscriber which provide internet, phone, and interactive TV. Through this study, the authors will analyze the cause of churn potential customers Indihome product, so that Telkom can minimize the churn number by doing customer retention program through the efficient caring.
Given by huge customer database the author will analyze using Big Data analytics method. Big Data is one method in data management that contain huge data, by mapping and data processing. Through various forms of output, big data implementation on the organization will provide better value in data-based decision making."

Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2018

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Ferry Astika Saputra

Pengembangan Sistem Deteksi Intrusi yang Dapat Diskalakan untuk Meningkatkan Efektifitas Deteksi Botnet Di Sistem IoT pada Lingkungan Komputasi Awan = Development of Scalable Intrusion Detection System to ImproveBotnet Detection in IoT System in Cloud Environment

Ancaman keamanan cyber berupa aktivitas Botnet merupakan salah satu ancaman berbahaya yang dihadapi oleh komunitas internet. Para peneliti telah mengusulkan sistem deteksi intrusi (IDS) yang bekerja dengan menggunakan algoritma machine learning sebagai solusi alternatif dari IDS yang menggunakan metode signature dan metode anomali untuk mendeteksi aktivitas Botnet.

Permasalahan yang dihadapi adalah sulitnya membedakan antara trafik normal dengan trafik Botnet. Perlu adanya pemilihan fitur dari data set jaringan sehingga trafik Botnet dapat dideteksi dengan akurat. Dalam penelitian ini diusulkan metode baru yang meningkatkan kinerja IDS dalam mendeteksi Botnet. Metode yang diusulkan adalah dengan menggabungkan dua metode statistik yaitu low variance filter yang dikombinasikan dengan Pearson Correlation Filter yang selanjutnya disebut dengan Hybrid Pearson Correlation Filter (HPCF) untuk diterapkan dalam tahap pemilihan fitur. Pemilihan fitur dengan metode yang diajukan yaitu HPCF (Hybrid Pearson Correlation Filter) terbukti dapat meningkatkan efektifitas dan efisiensi dari IDS. Efektivitas diukur dengan menggunakan metrik performasi. Dari hasil eksperimen offline maupun reatime detection, DT lebih unggul dari tujuh model ML lainnya. Model DT-15 merupakan kombinasi terbaik dengan performasi diatas 95% untuk offline detection, 99% untuk Real-time detection.

Pemilihan fitur juga berpengaruh terhadap efisiensi yang diukur dari waktu komputasi pembelajaran mode dan waktu komputasi deteksi di jaringan sebenarnya. Model DT-15 merupakan kombinasi terbaik dengan rata-rata waktu 6,3 detik untuk pembelajaran model (offline detection) and 350 detik untuk waktu deteksi di jaringan sebenarnya (Real-time detection).

Tantangan untuk membuat arsitektur IDS yang dapat beradaptasi dengan tekonologi komputasi awan juga menjadi topik dalam penelitian ini. Perubahan dinamis dalam arsitektur komputasi awan membutuhkan kemudahan dan fleksibilitas didistribusikan dan dikonfigurasi, dan sarana transportasi data yang paling andal ke defense center. Selain itu teknologi komputasi awan secara signifikan meningkatkan volume, kecepatan, dan variasi data yang harus diproses di pusat pertahanan. Ini berarti bahwa defense center membutuhkan teknologi big data. Snort adalah sistem deteksi dan pencegahan intrusi jaringan berbasis signature yang populer dan berpengaruh di komunitas Internet. Kekurangan dari Snort adalah keterbatasannya dalam menempatkan sensor dengan defense center yang harus terhubung dalam satau sama lain dalam satu jaringan. Hal ini bertolak belangkang dengan kebutuhan dari teknologi komputasi awan. Pada penelitian ini digunakan referensi arsitektur lambda. Dalam pengembangannya arsitektur terbagi menjadi tiga bagian: data source, data collecting dan data serving. Untuk data source dikembangkan aplikasi docker yang didalamnya terdapat aplikasi Snort IDS. Sedangkan untuk collecting data ddigunakan protokol MQTT sebagai saluran pengirimannya. MQTT lebih unggul dalam kemampuan pengirimanya dengan message rate 12 kali lebih besar dan latensi 62 kali lebih rendah dibandingkan dengan protokol Kafka Pub/Sub. Secara keseluruhan penelitian menghasilkan arsitektur baru big data penerapan sistem deteksi intrusi jaringan berbasis Snort di lingkungan komputasi awan. Aplikasi NIDS Snort yang dibangun dengan merujuk dari arsitektur yang telah dibangun dapat diakses di https://github.com/Mata-Elang-Stable/MataElang-Platform/wiki.

Cyber security threats in the form of botnet activities are one of the dangerous threats faced by the internet community. Researchers have proposed an intrusion detection system (IDS) that works using machine learning algorithms as an alternative solution to IDS that uses signature and anomaly methods to detect botnet activity.
The problem faced is the difficulty of distinguishing between normal traffic and Botnet traffic. There needs to be a selection feature from the network data set to detect Botnet traffic accurately. This study proposes a new method to improve IDS performance in detecting botnets. The proposed method combines two statistical methods, namely the low variance filter and the Pearson Correlation Filter, referred to as the Hybrid Pearson Correlation Filter (HPCF), to be applied in the feature selection stage. Feature selection with the proposed method, namely HPCF (Hybrid Pearson Correlation Filter), is proven to increase the effectiveness and efficiency of IDS. Effectiveness is measured using performance metrics. From the results of offline and real-time detection experiments, DT is superior to the other seven ML models. The DT-15 model is the best combination, with over 95% performance for offline detection and 99% for real-time detection.
The selection of features also affects the efficiency measured by the computational time of mode learning and the computational time of detection in the real network. The DT-15 model is the best combination, with an average time of 6.3 seconds for the learning model (offline detection) and 350 seconds for detecting in the real network (real-time detection).
Developing an IDS architecture that can adapt to cloud computing technology is also a topic in this research. Dynamic changes in cloud architecture require the flexibility of configuring and the most reliable means of data transportation for the defense center. In addition, cloud computing significantly increases the volume, speed, and variety of data that must be centralized in the defense center. So this means that the defense center needs big data technology. Snort is a signature-based network intrusion detection and prevention system that is popular and influential in the Internet community. The drawback of Snort is its limitation in placing sensors with central defenses that must be connected to a single network, which is contrary to the needs of cloud computing technology.
In this study, we refer to lambda architecture, which consists of three parts: data source, data collecting and serving. A docker application for the data source is developed, including the Snort IDS application. Meanwhile, the MQTT protocol is used as the delivery channel for collecting data. MQTT is superior in its delivery capabilities, with a message rate of 12 times more significant and latency 62 times lower than the Kafka Pub/Sub protocol. Overall, the research resulted in a new big data architecture for implementing a Snort-based network intrusion detection system in a cloud computing environment. Our proposed design and implementation can be accessed at https://github.com/Mata-Elang-Stable/MataElang-Platform/wiki.
"

Depok: Fakultas Teknik Universitas Indonesia, 2022

D-pdf

UI - Disertasi Membership Universitas Indonesia Library

Clustering methods for big data analytics techniques, toolboxes and applications

"This book highlights the state of the art and recent advances in Big Data clustering methods and their innovative applications in contemporary AI-driven systems. The book chapters discuss Deep Learning for Clustering, Blockchain data clustering, Cybersecurity applications such as insider threat detection, scalable distributed clustering methods for massive volumes of data; clustering Big Data Streams such as streams generated by the confluence of Internet of Things, digital and mobile health, human-robot interaction, and social networks; Spark-based Big Data clustering using Particle Swarm Optimization; and Tensor-based clustering for Web graphs, sensor streams, and social networks. The chapters in the book include a balanced coverage of big data clustering theory, methods, tools, frameworks, applications, representation, visualization, and clustering validation. "

Switzerland: Springer Nature, 2019

e20507207

eBooks Universitas Indonesia Library

Mugi Ayomi

Pengukuran tingkat kematangan big data: studi kasus Direktorat Jenderal Bea dan Cukai Kementrian Keuangan Republik Indonesia = Big data maturity assessment: a case study from Indonesian Customs and Excise

"ABSTRAK

Semakin strategisnya peran Direktorat Jenderal Bea dan Cukai (DJBC) Kementerian Keuangan Republik Indonesia dalam memfasilitasi perdagangan internasional membuat DJBC harus terus berinovasi dengan memanfaatkan teknologi mutakhir. DJBC dituntut untuk memberikan pelayanan yang efisien dan melakukan pengawasan yang efektif yang merujuk pada praktik-praktik terbaik dalam kepabeanan internasional. Implementasi Big Data pada DJBC bertujuan untuk mendapatkan manfaat dari data yang telah dikumpulkan agar dapat dianalisis untuk mendukung pengambilan keputusan. Konsep Smart Customs and Excise mengusung Big Data sebagai inti dari semua sistem dan proses bisnis pada DJBC, namun sampai dengan saat ini penerapan Big Data masih bersifat proof of concept. Penerapan teknologi baru tanpa adanya arah pengembangan yang jelas memiliki risiko kegagalan, untuk itu diperlukan evaluasi penerapan Big Data di DJBC. Pengukuran tingkat kematangan Big Data dapat digunakan sebagai langkah awal untuk menilai situasi yang sebenarnya dari sebuah organisasi, memperoleh dan memprioritaskan langkah-langkah perbaikan dan kemudian mengontrol setiap tahap pelaksanaannya. Hasil pengukuran kematangan Big Data dapat dijadikan sebagai acuan untuk merumuskan saran dan rekomendasi bagi DJBC untuk mencapai tingkat kematangan yang lebih tinggi. Pengukuran dilakukan menggunakan framework TDWI Big Data Maturity Model untuk mengevaluasi implementasi Big Data pada DJBC. Pengumpulan data dilakukan melalui wawancara pertanyaan tertutup, kemudian diolah menggunakan assessment tools. Hasil evaluasi menunjukkan bahwa tingkat kematangan Big Data pada DJBC ada pada tingkat 3 (Early Adoption) dari skala 1 - 5. Hasil penelitian memberikan rekomendasi pada tiap dimensi untuk dapat meningkatkan tingkat kematangan ke tingkat 4 (Corporate Adoption) dengan prioritas perubahan mulai dimensi organisasi, analitis, manajemen data, infrastruktur, dan tata kelola.

ABSTRACT

The more strategic role of the Directorate General of Customs and Excise (DGCE) of the Ministry of Finance of Republic of Indonesia in facilitating international trade has made DGCE to continue to innovate by utilizing the latest technology. DGCE is required to provide efficient services and conduct effective supervision that refers to international customs organization best practices. Implementation of Big Data on DGCE aims to get the benefits of the data that has been collected so that it can be analyzed to support decision making. The Smart Customs and Excise concept brings Big Data as the core of all systems and business processes in DGCE, but until now the implementation of Big Data is still proof of concept. Implementation of new technology without the direction of development that clearly defined has the risk of failure, therefore an evaluation is needed regarding the implementation of Big Data on DGCE. Measuring the maturity level of Big Data can be used as a first step to assess the actual situation of an organization, obtain and prioritize corrective steps and then control each stage of its implementation. The measurement results can be used as a reference to formulate suggestions and recommendations for DGCE to reach a higher maturity level. Measurements were made using the TDWI Big Data Maturity Model framework to evaluate the implementation of Big Data on DGCE. Data collection is done through closed question interviews, then processed using assessment tools. The evaluation results indicate that the maturity level of Big Data on DGCE is at phase 3 (Early Adoption) of scale 1 to 5. The results of the study provide recommendations on each dimension to be able to increase the maturity level to phase 4 (Corporate Adoption) with priority changes starting from the organizational dimension, analytics, data management, infrastructure, and governance.

2019

TA-Pdf

UI - Tugas Akhir Universitas Indonesia Library

Miller, James D.

Big data visualization: learn effective tools and techniques to separate big data into manageable and logical components for efficient data visualization

Birmingham: Packt Publishing, 2017

005.7 MIL b

Buku Teks SO Universitas Indonesia Library

Panji Winata

Perancangan arsitektur sistem pemrosesan big data menggunakan TOGAF framework: Studi kasus PT XYZ = Architectural design of big data processing system using TOGAF framework: A case study at PT XYZ / Panji Winata

"[ABSTRAK

PT. XYZ merupakan perusahaan telekomunikasi di Indonesia yang sedang

berusaha mentransformasikan bisnisnya menuju layanan broadband dan bisnis

digital. Banyak peluang bisnis di layanan broadband dan bisnis digital yang dapat

diidentifikasi dengan memproses dan menganalisis data dengan cepat, tepat, dan

menyeluruh. Saat ini PT. XYZ telah memiliki kemampuan dalam mengolah

beberapa sumber data yang terstruktur dengan ukuran data yang terbatas. Untuk

membuat perhitungan dan keputusan yang jitu, terutama di layanan broadband dan

bisnis digital, PT. XYZ dituntut juga untuk bisa memproses dan menganalisis data

yang memiliki karakteristik 3V (Velocity, Volume, Variety) atau dikenal dengan big

data. Penelitian ini bertujuan untuk merancang arsitektur sistem pemrosesan big

data di PT. XYZ. Kerangka arsitektur (framework) enteprise yang digunakan dalam

penelitian ini adalah TOGAF. Hasil yang diperoleh dari penelitian ini adalah

rancangan arsitektur sistem pemrosesan big data yang mampu mengolah data yang

memiliki karakteristik 3V, yaitu aliran data yang cepat, berukuran masiv, dan

beranekaragam (terstruktur maupun tidak terstruktur) dengan biaya lebih rendah

dari sistem pemrosesan data yang dimiliki PT. XYZ saat ini. Saran untuk penelitian

ini kedepannya adalah sistem pemrosesan big data di PT. XYZ dapat

diimplementasikan dengan baik jika mendapat dukungan penuh dari manajemen

perusahaan, dimulai dengan kasus bisnis yang spesifik (specific business case) yang

ingin disasar. Hasil yang maksimal dari kasus bisnis tersebut dapat dijadikan

landasan untuk investasi sistem pemrosesan big data yang lebih menyeluruh dalam

mendukung transformasi bisnis menuju layanan broadband dan bisnis digital.

ABSTRACT

PT. XYZ is a telecommunication company in Indonesia which is transforming it's business to broadband services & digital business. Many business opportunities in broadband services & digital business can be identified by processing and analyzing data quickly, accurately, and completely. Right now PT. XYZ has the capability in processing some structured data sources with limited data size. To make accurate calculations and decisions, especially in broadband services and digital business, PT. XYZ also required to be able to process and analyze the data that has the characteristics of 3V (Velocity, Volume, Variety) or known as big data. This research aims to design the architecture of big data processing system. The enterprise architecture framework used in this study is TOGAF. The results obtained from this study is the design of big data processing system architecture that is capable of processing data which has the characteristics of 3V (the fast data

flow, massive data size, and diverse structured or unstructured data sources) at a lower cost than the current data processing system in PT. XYZ. The suggestion about this study is the big data processing system can be implemented properly in PT. XYZ with the full support of the PT. XYZ management, started with a specific business use case that want targeted. The maximum results from the business use case can be used as a piloting for big data processing system investments more

thorough in supporting business transformation toward broadband services and digital business. ;PT. XYZ is a telecommunication company in Indonesia which is transforming it?s

business to broadband services & digital business. Many business opportunities in

broadband services & digital business can be identified by processing and analyzing

data quickly, accurately, and completely. Right now PT. XYZ has the capability in

processing some structured data sources with limited data size. To make accurate

calculations and decisions, especially in broadband services and digital business,

PT. XYZ also required to be able to process and analyze the data that has the

characteristics of 3V (Velocity, Volume, Variety) or known as big data. This

research aims to design the architecture of big data processing system. The

enterprise architecture framework used in this study is TOGAF. The results

obtained from this study is the design of big data processing system architecture

that is capable of processing data which has the characteristics of 3V (the fast data

flow, massive data size, and diverse structured or unstructured data sources) at a

lower cost than the current data processing system in PT. XYZ. The suggestion

about this study is the big data processing system can be implemented properly in

PT. XYZ with the full support of the PT. XYZ management, started with a specific

business use case that want targeted. The maximum results from the business use

case can be used as a piloting for big data processing system investments more

thorough in supporting business transformation toward broadband services and

digital business. , PT. XYZ is a telecommunication company in Indonesia which is transforming it’s