Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 32107 dokumen yang sesuai dengan query
cover
Sangeeta Gupta
"The massive amounts of data collected from numerous sources like social media, e-commerce websites are a challenging aspect for analysis using the available storage technologies. Relational databases are a traditional approach of data storage more suitable for structured data formats and are constrained by Atomicity, Consistency, Isolation, and Durability (ACID) properties. In the modern world, data in the form of word documents, pdf files, audio and video formats are unstructured. Therefore, tables and schema definition are not a major concern, Relational databases, such as Mysql, may not be suitable to serve such Bigdata. An alternate approach is to use the emerging Nosql databases. In this work, a comprehensive performance and scalability evaluation of large web collection data in data stores, such as Nosql-Cassandra and relational-Mysql, is presented. These systems are evaluated with data and workloads that can be found related to Bigdata, yielding scalability of applications. The insights presented in this work serve not only for performance and scalability, but also as lessons learned and experiences relating to the configuration complexity and evaluation in sorting out the complex queries of what data storage can be used on which usage cases for large data sets. The results show how the Bigdata collected across the Web with billions of records generating continuously are poorly evaluated with Mysql in terms of ‘write’ operations, but how these perform well with Nosql-Cassandra. This paper yields a new approach which is unique in representing Nosql-Cassandra’s poor performance in retrieval of records and disk utilisation with ever-increasing loads. The results presented in this paper show an improvement in ‘read’ performance with the proposed architecture and configuration over Mysql, achieving cost saving benefits to any organisation willing to use Nosql-Cassandra for managing Bigdata for heavy loads."
Depok: Faculty of Engineering, Universitas Indonesia, 2015
UI-IJTECH 6:4 (2015)
Artikel Jurnal  Universitas Indonesia Library
cover
Wahyu Setyo Prabowo
"Keuntungan Cloud Computing (CC) merupakan teknologi baru yang mempunyai karakteristik on-demand self service, broad network access, resource pooling, rapid elasticity, dan measured service, yang menjanjikan efisiensi dan efektifitas operasional Teknologi Informasi dan Komunikasi (TIK) pada organisasi. Permasalah pada CC dalam mendukung kinerja Lembaga Pemerintahan masih menjadi belum perhatian khusus. Artikel ini memaparkan hasil migrasi data center berbasis CC (Virtual Private Data Center) yang diterapkan pada Lembaga Ilmu Pengetahuan Indonesia (LIPI). Model penerapan ini diharapkan bisa menjadi acuan untuk instansi pemerintah lain yang memiliki karakteristik dan serumpun dengan LIPI maupun instansi pemerintah lain dalam melaksanakan pengelolaan TIK untuk bisa lebih banyak mendapatkan manfaat dari CC sehingga efektifitas dan efisiensi pengelolaan TIK dapat tercapai. "
Kementerian Komunikasi dan Informasi Ri, 2015
384 JPPKI 6:2 (2015)
Artikel Jurnal  Universitas Indonesia Library
cover
Rahmatul Mahdalina
"Teknologi mempengaruhi berbagai lini kehidupan masyarakat. Penggunaan transportasi, memenuhi kebutuhan seperti belanja, bahkan juga untuk bersosialisasi semuanya menggunakan teknologi. Aktivitas seperti jual beli juga pun terpengaruh, hingga mendorong munculnya e-commerce. E-commerce tentu berkaitan dengan pelanggan maupun pengguna e-commerce yang mengungkapkan berbagai opininya. Beberapa opini disampaikan melalui media sosial yang dimiliki oleh e-commerce salah satunya adalah Twitter. Opini inilah yang menarik dieksplorasi untuk diketahui sentimen dan tingkat kepuasan dari pelanggan e-commerce. Oleh karenanya, penelitian ini bertujuan untuk menyusun aspek kepuasan pelanggan dan juga menentukan metode Lexicon yang relevan untuk analisis sentimen. Data diambil dari microblogs Twitter terbatas pada 5 penyelenggara e-commerce yaitu Blibli, Bukalapak, Lazada, Shopee, dan Tokopedia sebanyak 88.816 tweet. Dikategorisasikan ke dalam aspek-aspek sehingga menjadi 12.995 tweet. Aspek-aspek kepuasan pelanggan disusun melalui studi literatur dan menghasilkan 6 aspek. Keenam aspek tersebut adalah aspek produk, penjual, logistik, harga, layanan, dan sistem. Kategorisasi tweet ke dalam aspek menggunakan kata kunci berkaitan dengan aspek-aspek sebanyak 73 kata kunci yang dihasilkan dari analisis hasil word cloud dan topic modelling yang menggunakan LDA. Untuk pemilihan metode lexicon dibuat skenario yang diujikan pada 300 tweet yang dilabeli secara manual dan dipilih secara acak dari data aspek. Skenario yang dilakukan pada data berlabel ada dua, yaitu menggunakan Lexicon 1 dan Lexicon 2. Lexicon 1 adalah perbandingan kamus, sedangkan Lexicon 2 merupakan perbandingan rumus yang berbeda. Hasil Lexicon 1 adalah seluruh kamus memiliki nilai akurasi sama yaitu 0,54. Sedangkan pada Lexicon 2 memiliki nilai akurasi tertinggi yaitu 0,46 dari kamus berskala 1 dengan rumus pertama. Sehingga, metode terpilih adalah Lexicon 1 menggunakan kamus InSet. Penerapan kategorisasi aspek menghasilkan bahwa aspek dominan pada masing-masing e-commerce dan pada keseluruhan e-commerce adalah aspek produk. Penerapan metode berbasis leksikon pada analisis sentimen menghasilkan bahwa di seluruh e-commerce pada setiap aspeknya memiliki sentimen dominan positif. Implikasi dari penelitian ini adalah bertambahnya khazanah ilmu pengetahuan berkaitan kepuasan pelanggan dan bervariasinya kamus serta metode berbasis leksikon yang dapat menjadi referensi dan penelitian lebih lanjut. Selain itu, bagi penyelenggara e-commerce penelitian ini dapat membantu analisis untuk peningkatan maupun pengambilan kebijakan.

Technology affects various lines of people's lives. The use of transportation, meeting needs such as shopping, and even socializing all use technology. Activities such as buying and selling were also affected, thus encouraging the emergence of e-commerce. E-commerce is undoubtedly related to customers and e-commerce users who express various opinions. Some opinions are conveyed through social media owned by e-commerce, one of which is Twitter. This opinion is interesting to be explored to find out the sentiment and satisfaction level of e-commerce customers. Therefore, this study aims to compile aspects of customer satisfaction and determine the Lexicon method relevant to sentiment analysis. Data was taken from Twitter microblogs limited to 5 e-commerce organizers, namely Blibli, Bukalapak, Lazada, Shopee, and Tokopedia, with a total of 88,816 tweets. Categorized into aspects so that it becomes 12,995 tweets. Aspects of customer satisfaction are compiled through literature studies and produce six aspects. The six aspects are product, seller, logistics, price, service, and system. Categorizing tweets into aspects using keywords related to aspects as many as 73, resulting from analysis of word cloud results and topic modeling using LDA.
For the selection of the lexicon method, scenarios were created that were tested on 300 tweets labeled manually and randomly selected from aspect data. Two scenarios were performed on labeled data using Lexicon 1 and Lexicon 2. Lexicon 1 is a comparison of dictionaries, while Lexicon 2 is a comparison of different formulas. The result of Lexicon 1 is that all dictionaries have the same accuracy value of 0.54. Meanwhile, Lexicon 2 has the highest accuracy value of 0.46 on a scale of one dictionary with the first formula. So, the chosen method is Lexicon 1 using the InSet dictionary. The application of aspect categorization results in the dominant aspect in each e-commerce, and all e-commerce is the product aspect. Applying the lexicon-based method to sentiment analysis results in all e-commerce has dominant positive sentiment in every aspect. The implication of this research is to increase the knowledge related to customer satisfaction and the variety of dictionaries and lexicon-based methods that can be used as references and further research. In addition, for e-commerce organizers, this research can assist analysis for improvement and policy making.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Azilahwati binti Adam
"Current technological advances, particularly in information and communications technology (ICT) and social media have sparked a phenomenon in the business world. The existence of social commerce (s-commerce), which is a combination of e-commerce and social media, has opened up greater opportunities for SMEs in Malaysia. The use of s-commerce as a medium for marketing and buying and selling is capable of helping SMEs to increase the sales and profitability of their businesses. However, according to studies conducted by SME Corp Malaysia, the usage of e-commerce and social media is still low. Attitude and self-efficacy are variables that are often used in studies related to entrepreneurs and their intention to accept a new business innovation or technology. Therefore, this study was undertaken to identify the internal factors within entrepreneurs, namely attitude and self-efficacy, which influence the acceptance and use of s-commerce among SMEs in Malaysia."
Universitas Pelita Harapan. Jurusan Manajemen, {s.a.}
338 DEREMA 11:1 (2016)
Artikel Jurnal  Universitas Indonesia Library
cover
Rahmani Shadrina
"User interfacepada website merupakan hal yang penting bagi jalannya suatu e-business. Namun, beberapa elemen perlu dipahami terkait dengan preferensi user interfacepada generasi X dan Y karena hal ini mempengaruhi keberlangsungan dari e-businesstersebut. Dalam pengembangannya, penelitian ini akan mengeksplorasi hubungan elemen-elemen dalamuser interfacedan generasi untuk dapat menggali pandangan serta masukan lebih mendalam mengenai user interfaceyang sesuai dengan karakteristik generasi X dan Y. Kemudian dari hasil yang didapatkan tersebut dilakukan penelitian lanjutan dengan melakukan penelitian kepada pengguna website e-businessuntuk mengevaluasi dan mengkonfirmasi kesesuaian desain user interfacedari ahli dengan preferensi pengguna. Hasil penelitian menunjukkan tingkat kesepakatan yang tinggi antara pengguna dengan rekomendasi desain user interfaceberdasarkan karakteristik generasi X dan Y dari para ahli. Hasil dari proses evaluasi dan konfirmasi tersebut kemudian dapat menjadi acuan bagi pelaku e-business dalam mengembangkan bisnisnya.

The user interface on the website is important for e-businesses. However, there is a need for deeper understanding on some elements of user interface to maintain sustainability of the relevant businesses, specifically those with generations X and Y target market. This research explores the relationship between user interface elements and generational preferences with in-depth interviews and questionnaires. The primary objective of this research is to get a more holistic view on user preference by employing interviews with e-business websites users to further evaluate preliminary designs and other data gathered from a group of experts. For this research, 200 subjects (100 subjects each from generations X and Y) participated in the test. The results show a high level of alignment between users and user interface design recommendations based on generations X and Y characteristics from experts. The final results can be used as a reference for e-business in developing their websites.
"
Jakarta: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2018
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Arief Chaharuddin
"Tesis ini membahas mengenai dampak lokalisasi data pada sektor e-commerce dilihat dari sudut pandang ASEAN Agreement on E-Commerce dan Pasal XIV dari General Agreements Trade in Services dengan pokok permasalahan pertama adalah mengenai dampak lokalisasi data dan cross border data transfer pada pertumbuhan perdagangan di ASEAN, permasalahan kedua adalah bagaimana kedisiplinan penerapan lokalisasi data di negara-negara ASEAN dilihat dari peraturan ASEAN Agreement on E-commerce dan permasalahan ketiga adalah apakah penerapan pengecualian di dalam ASEAN Agreement on E-Commerce dan Pasal XIV dari General Agreements Trade in Services sebagai penyeimbang antara perlindungan data dan liberalisasi perdagangan. Metode penelitian dan teori hukum yang dipergunakan untuk membahas permasalahan dalam tesis ini adalah metode penelitian yuridis normatif. Hasil penelitian menunjukan bahwa lokalisasi data menjadi hambatan dari perdagangan secara global, penerapan lokalisasi data menjadikan suatu negara tidak menarik di mata investor karena penempatan server di negara tempat berbisnis dan biaya yang tinggi. Belum semua negara memiliki hukum perlindungan data pribadi, beberapa negara seperti Kamboja, Laos, dan Myanmar tidak memiliki peraturan yang komprehensif mengatur perlindungan data. Vietnam masih mempertahankan lokalisasi data dengan mangharuskan perusahaan asing menempatkan server di negaranya. Dibutuhkan perjanjian regional seperti ASEAN Agreement on E-commerce untuk harmonisasi perlindungan data di ASEAN terutama di sektor e-commerce. Dibutuhkan balancing untuk menyeimbangkan perdagangan dan perlindungan data, salah satu alat yang dapat digunakan adalah GATS Pasal XIV dimana terdapat pengecualian terutama untuk Privasi dan Ketertiban Umum. Pengaturan di GATS Pasal XIV dan Weighing dan Balancing dapat menjadi equilibrium dalam keseimbangan perdagangan dan perlindungan data.

This thesis discusses the impact of data localization on the e-commerce sector from the perspective of the ASEAN Agreement on E-Commerce and GATS Article XIV . The first problem is the impact of data localization on trade conditions between ASEAN countries, The second problem is how discipline the implementation of data localization is in ASEAN countries, seen from the regulations of the ASEAN Agreement on E-commerce, and The third issue is whether the application of exceptions in the ASEAN Agreement on E-Commerce and Article XIV of the General Agreements on Trade in Services can bring balance between data protection and trade liberalization.. The research method and legal theory used to discuss the problems in this thesis are normative juridical research methods. The research results show that data localization is an obstacle to global trade, the implementation of data localization makes a country unattractive in the eyes of investors because of the placement of servers in the country where they do business and high costs. Not all countries have personal data protection laws, some countries such as Cambodia, Laos and Myanmar do not have comprehensive regulations governing data protection. Vietnam still maintains data localization by requiring foreign companies to locate servers in the country. Regional agreements such as the ASEAN Agreement on E-commerce are needed to harmonize data protection in ASEAN, especially in the e-commerce sector. Balancing is needed to balance trade and data protection, one tool that can be used is GATS Article XIV where there are exceptions, especially for Privacy and Public Order. The arrangements in GATS Article XIV and Weighing and Balancing can be an equilibrium in the balance of trade and data protection."
Jakarta: Fakultas Hukum Universitas Indonesia, 2023
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Hendrico Kristiawan
"Pertanyaan konsultasi pada sebuah forum daring perlu dijawab oleh dokter spesialis yang tepat agar jawaban yang diberikan akurat dan bermanfaat bagi pengguna yang bertanya. Terkait hal tersebut, penelitian ini membahas tentang pengembangan model yang dapat secara otomatis mengarahkan sebuah pertanyaan konsultasi kesehatan ke dokter dengan spesialisasi yang sesuai. Lebih jauh lagi, model yang dibangun merupakan model klasifikasi multi-label karena sebuah pertanyaan dapat terasosiasi dengan lebih dari satu spesialisasi. Penelitian ini dimulai dengan mengevaluasi keefektifan metode pemetaan berbasis aturan dalam memprediksi data yang dianotasi oleh pakar, dan diperoleh hasil yang menunjukkan tingkat keberhasilan yang cukup. Selanjutnya, dikembangkan sebuah model machine learning yang melakukan klasifikasi domain spesialis dokter. Pelatihan model dilakukan dengan berbagai metode, termasuk supervised, unsupervised, serta semi-supervised learning. Model terbaik ditemukan melalui metode domain adaptive pre-training dengan IndoBERT-large sebagai model acuan dan melibatkan unsupervised learning. Selain itu, model supervised learning juga digunakan dengan menggunakan model konvensional, dan hasilnya digunakan untuk analisis kontribusi dari fitur-fitur yang digunakan dalam klasifikasi. Terakhir, penelitian ini mengevaluasi kembali anotasi yang dilakukan oleh manusia dengan menggunakan kata kunci sebagai pendekatan untuk mengurangi kesalahan dalam dataset. Dengan pendekatan ini, berhasil ditemukan beberapa kesalahan anotasi pada dataset yang dianotasi oleh manusia.

The consultation questions on an online forum need to be answered by the appropriate specialist doctors to provide accurate and beneficial answers to the users asking the questions. In relation to this, this study discusses the development of a model that can automatically direct a health consultation question to a doctor with the corresponding specialization. Furthermore, the constructed model is a multi-label classification model because a question can be associated with more than one specialization. There are several issues addressed in this work. This research begins by evaluating the effectiveness of rule-based mapping methods in predicting data annotated by experts, and the results show a satisfactory level of success. Furthermore, a multi-label classification model is developed to classify the specialist domains of doctors. The model training is performed using various methods, including supervised learning, unsupervised learning, and semi-supervised learning. The best model is found through domain adaptive pre-training using IndoBERT-large as the reference model and involving unsupervised learning. Additionally, the supervised learning model is also used with a conventional model, and the results are used to analyze the contribution of the features used in the classification. Lastly, this research re-evaluates the annotations made by humans using keyword-based approaches to reduce errors in the dataset. With this approach, several annotation errors were successfully identified in the dataset annotated by humans.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nabila Dita Putri
"Saat ini, dataset yang tersedia untuk melakukan analisis emosi di Indonesia masih terbatas, baik dari segi jumlah data, cakupan emosi, serta sumbernya. Pada penelitian ini, peneliti membangun dataset besar untuk tugas analisis emosi pada data teks berbahasa Indonesia, di mana dataset ini dikumpulkan dari berbagai domain dan sumber. Dataset ini mengandung 33 ribu teks, yang terdiri dari tweet yang dikumpulkan dari Twitter, serta komentar unggahan yang dikumpulkan dari Instagram dan Youtube. Domain yang dicakup pada dataset ini adalah domain olahraga, hiburan, dan life chapter. Dataset ini dianotasi oleh 36 annotator dengan label emosi fine-grained secara multi-label, di mana label emosi yang digunakan ini merupakan hasil dari taksonomi emosi baru yang diusulkan oleh peneliti. Pada penelitian ini, peneliti mengusulkan taksonomi emosi baru yang terdiri dari 44 fine-grained emotion, yang dikelompokkan ke dalam 6 basic emotion. Selain itu, peneliti juga membangun baseline model untuk melakukan analisis emosi. Didapatkan dua baseline model, yaitu hasil fine-tuning IndoBERT dengan f1-score micro tertinggi sebesar 0.3786, dan model hierarchical logistic regression dengan exact match ratio tertinggi sebesar 0.2904. Kedua baseline model tersebut juga dievaluasi di lintas domain untuk dilihat seberapa general dan robust model yang telah dibangun.

Currently, no research in Indonesia utilises fine-grained emotion for emotion analysis. In addition, the available datasets for analysing emotions still need to be improved in terms of the amount of data, the range of emotions, and their sources. In this study, researchers built a large dataset for analysing emotion. This dataset contains 33k texts, consisting of tweets collected from Twitter and comments collected from Instagram and Youtube posts. The domains covered in this dataset are sports, entertainment, and life chapter. Thirty-six annotators annotated this dataset with fine-grained emotion labels and a multi-label scheme, where the emotion labels resulted from a new emotion taxonomy proposed by the researcher. In this study, the researchers propose a new emotion taxonomy consisting of 44 fine-grained emotions which are grouped into six basic emotions. Two baseline models were obtained, the first one is the fine-tuned IndoBERT model, which achieved the highest f1-score micro of 0.3786, and the second one is hierarchical logistic regression model, which achieved the highest exact match ratio of 0.2904. Both baseline models were also evaluated to determine their cross-domain applicability. The dataset and baseline models that are produced in this study are expected to be valuable resources for future research purposes."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Kaysa Syifa Wijdan Amin
"Saat ini, dataset yang tersedia untuk melakukan analisis emosi di Indonesia masih terbatas, baik dari segi jumlah data, cakupan emosi, serta sumbernya. Pada penelitian ini, peneliti membangun dataset besar untuk tugas analisis emosi pada data teks berbahasa Indonesia, di mana dataset ini dikumpulkan dari berbagai domain dan sumber. Dataset ini mengandung 33 ribu teks, yang terdiri dari tweet yang dikumpulkan dari Twitter, serta komentar unggahan yang dikumpulkan dari Instagram dan Youtube. Domain yang dicakup pada dataset ini adalah domain olahraga, hiburan, dan life chapter. Dataset ini dianotasi oleh 36 annotator dengan label emosi fine-grained secara multi-label, di mana label emosi yang digunakan ini merupakan hasil dari taksonomi emosi baru yang diusulkan oleh peneliti. Pada penelitian ini, peneliti mengusulkan taksonomi emosi baru yang terdiri dari 44 fine-grained emotion, yang dikelompokkan ke dalam 6 basic emotion. Selain itu, peneliti juga membangun baseline model untuk melakukan analisis emosi. Didapatkan dua baseline model, yaitu hasil fine-tuning IndoBERT dengan f1-score micro tertinggi sebesar 0.3786, dan model hierarchical logistic regression dengan exact match ratio tertinggi sebesar 0.2904. Kedua baseline model tersebut juga dievaluasi di lintas domain untuk dilihat seberapa general dan robust model yang telah dibangun.

Currently, no research in Indonesia utilises fine-grained emotion for emotion analysis. In addition, the available datasets for analysing emotions still need to be improved in terms of the amount of data, the range of emotions, and their sources. In this study, researchers built a large dataset for analysing emotion. This dataset contains 33k texts, consisting of tweets collected from Twitter and comments collected from Instagram and Youtube posts. The domains covered in this dataset are sports, entertainment, and life chapter. Thirty-six annotators annotated this dataset with fine-grained emotion labels and a multi-label scheme, where the emotion labels resulted from a new emotion taxonomy proposed by the researcher. In this study, the researchers propose a new emotion taxonomy consisting of 44 fine-grained emotions which are grouped into six basic emotions. Two baseline models were obtained, the first one is the fine-tuned IndoBERT model, which achieved the highest f1-score micro of 0.3786, and the second one is hierarchical logistic regression model, which achieved the highest exact match ratio of 0.2904. Both baseline models were also evaluated to determine their cross-domain applicability. The dataset and baseline models that are produced in this study are expected to be valuable resources for future research purposes."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Gilang Catur Yudishtira
"Saat ini, dataset yang tersedia untuk melakukan analisis emosi di Indonesia masih terbatas, baik dari segi jumlah data, cakupan emosi, serta sumbernya. Pada penelitian ini, peneliti membangun dataset besar untuk tugas analisis emosi pada data teks berbahasa Indonesia, di mana dataset ini dikumpulkan dari berbagai domain dan sumber. Dataset ini mengandung 33 ribu teks, yang terdiri dari tweet yang dikumpulkan dari Twitter, serta komentar unggahan yang dikumpulkan dari Instagram dan Youtube. Domain yang dicakup pada dataset ini adalah domain olahraga, hiburan, dan life chapter. Dataset ini dianotasi oleh 36 annotator dengan label emosi fine-grained secara multi-label, di mana label emosi yang digunakan ini merupakan hasil dari taksonomi emosi baru yang diusulkan oleh peneliti. Pada penelitian ini, peneliti mengusulkan taksonomi emosi baru yang terdiri dari 44 fine-grained emotion, yang dikelompokkan ke dalam 6 basic emotion. Selain itu, peneliti juga membangun baseline model untuk melakukan analisis emosi. Didapatkan dua baseline model, yaitu hasil fine-tuning IndoBERT dengan f1-score micro tertinggi sebesar 0.3786, dan model hierarchical logistic regression dengan exact match ratio tertinggi sebesar 0.2904. Kedua baseline model tersebut juga dievaluasi di lintas domain untuk dilihat seberapa general dan robust model yang telah dibangun.

Currently, no research in Indonesia utilises fine-grained emotion for emotion analysis. In addition, the available datasets for analysing emotions still need to be improved in terms of the amount of data, the range of emotions, and their sources. In this study, researchers built a large dataset for analysing emotion. This dataset contains 33k texts, consisting of tweets collected from Twitter and comments collected from Instagram and Youtube posts. The domains covered in this dataset are sports, entertainment, and life chapter. Thirty-six annotators annotated this dataset with fine-grained emotion labels and a multi-label scheme, where the emotion labels resulted from a new emotion taxonomy proposed by the researcher. In this study, the researchers propose a new emotion taxonomy consisting of 44 fine-grained emotions which are grouped into six basic emotions. Two baseline models were obtained, the first one is the fine-tuned IndoBERT model, which achieved the highest f1-score micro of 0.3786, and the second one is hierarchical logistic regression model, which achieved the highest exact match ratio of 0.2904. Both baseline models were also evaluated to determine their cross-domain applicability. The dataset and baseline models that are produced in this study are expected to be valuable resources for future research purposes."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>