Dokumen peraturan perundang-undangan pada umumnya tersedia dalam bentuk PDF
yang bersifat tidak machine-readable, sehingga data tidak dapat diproses secara otoma-tis dan dalam skala besar oleh komputer untuk dimanfaatkan dalam berbagai teknologi digital. Oleh karena itu diperlukan struktur data yang dapat memuat informasi peraturan perundang-undangan, beserta sistem yang melakukan konversi dari PDF menjadi struk-tur data tersebut. Dengan alasan tersebut, pada penelitian ini penulis mengembangkan Lex2KG, framework untuk mengonversi dokumen PDF peraturan perundang-undangan di Indonesia (Lex berasal dari Bahasa Latin yang berarti hukum) menjadi knowledge gra-ph. Knowledge graph (KG) adalah graph yang menggambarkan entitas dunia nyata be-serta keterkaitannya dan memberikan informasi terstruktur yang machine-readable. Pada penelitian ini KG dipilih dari berbagai struktur data yang tersedia karena KG terkate-gori sebagai 5-star data menurut 5-star deployment scheme for Open Data, yaitu data dengan jenis informasi paling bermanfaat, memberikan data dalam bentuk open license,terstruktur, tersedia dalam open format, menggunakan URI sebagai notasi data, dan dapat dihubungkan (linked) dengan data lain. KG peraturan perundang-undangan mengandung berbagai data terstruktur konten tekstual, struktur dokumen, seperti metadata, serta relasi antara peraturan seperti amendemen dan rujukan. Lex2KG memungkinkan pemanfaatan data peraturan perundang-undangan secara advanced, otomatis, dan dalam skala besar pada berbagai lingkup digital terutama pada industrsi hukum dan pengacara. Contoh pemanfaatan data dapat berupa search engine, sistem question answering, dan analisis statistik peraturan perundang-undangan. Menggunakan Lex2KG, penulis berhasil meng-onversi 784 undang-undang menjadi KG dengan ukuran total lebih dari 1,1 juta triple.
Salah satu peraturan yang berhasil dikonversi adalah UU 11/2020 tentang Cipta Kerja
yang kontennya bersifat relatif kompleks dan berukuran besar. Penulis juga menunjuk-
an use case dari KG peraturan perundang-undangan yaitu chat bot sederhana, SPARQL
query, dan visualisasi peraturan perundang-undangan
Most of the legal documents are available as PDF which is not machine-readable, whichmeans the data could not be processed automatically and in large scale by a computerto be utilized in various digital technology. Therefore, we need a data structure that cancontain a legal information, and also a system which converts PDF into that structure. Forthat reason, in this research, author developed Lex2KG, a framework wh converting legalPDF documents in Indonesia (Lex comes from Latin which means law) into a KnowledgeGraph. A knowledge graph (KG) is a graph that describes real-world entities and theirrelationships as machine-readable and structured information, and linkable to another KGon different domain. In this research KG is choosen from various data structure availablebecause KG it categorized as 5-star data according to 5-star deployment scheme for OpenData, which data comes with most beneficial information, available under an open licen-se, structured, open format, uses URI to denote things, and linkable to other data. Thelegal KG contains various kinds of structured data such as textual content, document stru-ctures, metadata, and relations between law such as amendments and citations. Lex2KGenables the advanced and automatic utilization of legal data on a large scale on a variousdigital scope especially on legal industry and lawyer. The utilization could be in formof search engine, question answering system, and statistics analytics for legals. ThroughLex2KG, author have successfully converted 784 Indonesian laws into a KG with a totalsize of over 1.1 million triples. One of the regulation that was successfully converted wasLaw 11/2020 on Job Creation, which the content is relatively complex and large. Authoralso shows use cases of the legal KG for simple chatbots, SPARQL querying, and legalvisualizations.