ABSTRAKDi dalam disertasi ini dibuat satu metode baru pembuatan Mashup melalui sistem pemodelan pohon DOM yang dibentuk secara otomatis menggunakan algoritma Xtractorz. Mashup merupakan sebuah aplikasi web yang mengkombinasikan data atau fungsi dari dua atau lebih sumber eksternal (halaman web) untuk membuat satu bentuk layanan (new servives) di halaman web yang baru.
Pohon DOM merupakan satu bentuk platform yang berguna untuk merepresentasikan beragam obyek dokumen halaman web berformat HTML atau XML untuk ditampilkan menjadi satu bentuk struktur pohon (tree-structure) atau lazimnya disebut node-tree Dengan menggunakan pendekatan platform struktur pohon DOM tersebut maka web browser dapat dengan mudah menginterpretasikan struktur kode HTML dari satu halaman web. Maksudnya, seluruh node yang ada dalam struktur kode HTML dari satu halaman web dapat diidentifikasi dan dimodifikasi struktur datanya secara mudah dan cepat.
Tujuan dari metode baru ini adalah untuk memudahkan pengguna membuat satu rangkaian tahapan pembuatan Mashup secara online via Internet. Untuk mengimplementasikan metode baru tersebut, di dalam penelitian ini telah dibangun satu tool baru pembuat Mashup yang dinamakan Xtractorz. Tool Xtractorz terdiri dari algoritma induk dan algoritma turunannya serta sekumpulan aturan yang didisain untuk mampu membuat satu Mashup yang diawali proses ekstraksi tabel data dari satu halaman web HTML di Internet.
Proses pembuatan Mashup dimulai dengan memetakan seluruh struktur kode-kode atau tag-tag tabel HTML yang berhasil diekstraksi dari satu halaman web. Kode-kode HTML yang merepresentasikan seluruh tabel di dalam halaman web HTML selanjutnya dipisahkan oleh algoritma induk Xtractorz untuk dikelompokan menjadi kelompok node Root, Parent, Child, Sibling dan Leaf.
Pengelompokkan tersebut kemudian ditransformasikan bentuknya menjadi satu struktur pohon DOM yang dibentuk secara otomatis oleh tool Xtractorz. Struktur pohon DOM tersebut selanjutnya menjadi referensi untuk proses komputasi di setiap tahapan pembuatan Mashup, seperti tahap Data Retrieval, Data (Source) Modeling, Data Cleaning/ Filtering, Data Integration hingga Data Visualization.
Hasil akhir tahapan pembuatan Mashup adalah beragam bentuk produk keluaran sesuai kebutuhan atau keinginan pengguna, contohnya dalam bentuk tabel PDF, tabel XML atau bentuk keluaran lainnya.
Pengujian terhadap metode baru pembuatan Mashup dilakukan dengan cara menguji tool Xtractorz menggunakan skenario dan lingkungan pengujian yang pernah dilakukan oleh tools pembuat Mashup sejenis, yaitu Karma dan Dapper. Pengujian dilakukan oleh para penguji dengan kualifikasi programmers dan non-programmers yang merepresentasikan para pengguna Internet. Pengujian dilaksanakan dengan memberikan model penugasan Task 1, Task 2 dan Task 3.
Pada prinsipnya para penguji diberi tugas melakukan pembuatan satu Mashup sesuai skenario penugasan yang diterima. Proses pembuatan Mashup diawali dengan tahapan ekstraksi tabel data secara online dan real time dari beberapa sumber halaman web HTML di Internet. Data hasil pengujian menunjukkan bahwa performa tool Xtractorz lebih unggul dibandingkan dengan tools Dapper dan Karma. Keunggulan tersebut dibuktikan dengan keberhasilan tool Xtractorz menyelesaikan seluruh rangkaian tahapan pembuatan Mashup secara lengkap dengan waktu proses (time spent) yang lebih cepat.
Selain itu algoritma induk Xtractorz dan turunannya mampu menyelesaikan seluruh lima tahapan standar pembuatan Mashup, mulai dari tahap Data Retrieval, Data Modeling, Data Cleaning/ Filtering, Data Integration hingga Data Visualization yang tidak dapat dilakukan oleh tools sejenis lainnya.
Dari hasil pengujian dapat ditarik kesimpulan bahwa metode baru pembuatan Mashup melalui sistem pemodelan pohon DOM yang dibentuk secara otomatis menggunakan algoritma Xtractorz memiliki performa yang dapat diandalkan bagi para pengguna Internet membuat satu Mashup secara mudah dan cepat.
ABSTRACTIn this dissertation, we created a new method for building a Mashup through DOM tree modeling system that automatically generated by using Xtractorz algorithm. Mashup is a web based application which combine data or function from two external sources (web pages) or more in order to create new services in the new web pages.
DOM tree is a useful platform to represent various HTML or XML web pages document object in a form of tree structure or commonly called node-tree. With the use of DOM tree structure approach then the web browser could interpret the HTML tags structure from a web page very easily. This mean that all the nodes exist inside the HTML tags structure within a web page can be easily identify or modify its data structures.
The aim of this new method is to help the Internet users to build a Mashup via online Internet. In order to implement this new method, a new Mashup builder tool called Xtractorz has been build in this research project. The Xtractorz tool consists of a main algorithm and its derivative algorithms completed with a set of rules which is designed to be capable to build a Mashup through a process of data table extraction from an HTML web page on the Internet.
The process of building a Mashup is initiated by mapping the whole structure of a webpage HTML codes or tags that has been succesfully extracted and grouped from a single web page. Afterward, those HTML codes or tags that represent the web HTML tables will be grouped into Root, Parent, Child, Sibling and Leaf Nodes by the Xtractorz main algorithm.
Those group of nodes will be transformed to a DOM tree structure model which is automatically build by Xtractorz tool. This DOM tree structure will be used as a main reference for computation process in every stages of building a Mashup, such as Data Retrieval, Data (Source) Modeling, Data Cleaning/Filtering, Data Integration and Data Visualization.
The end result of Mashup building stages will be the variety of output as expected or needed by the users, for example in the form of PDF and XML tables and many more output forms. The new method of building a Mashup has been tested by testing the Xtractorz tool using the same scenario and environment test that has been done previously by similar Mashup builder tools, called Karma and Dapper. The tests has been done by the appointed testers with the qualification of programmers and non-programmers background as the representative of Internet users. The serial tests have been deployed with specific tasks model, namely Task 1, Task 2 and Task 3.
Basically, the appointed testers created a Mashup as written on the scenario. The stage of building a Mashup is initiated by an on-line and real-time process of web data table extraction from the Internet.
The data test results showed that the Xtractorz tool performance is better than the other tools, Karma and Dapper. This can be proofed by the successful test of Xtractorz tool which can complete the whole process of building a Mashup with the minimum time spent or more faster.
In addition to that, the Xtractorz main algorithm and its derivatives can also complete the five stages standardization of building a Mashup, starting from Data Retrieval, Data Modeling, Data Cleaning/ Filtering, Data Integration until Data Visualization stage which can not be performed completely by other similar tools.
As conclusion, the result test showed that this new method for building a Mashup through DOM tree modeling system which automatically generated using Xtractorz algorithm has a better performance that could help the Internet users to build a Mashup more faster and easily.