Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 144523 dokumen yang sesuai dengan query
cover
Aprilian Tantra Luhur Achmad
"Tujuan dari pengembangan proyek Automatic Indonesian News Generation System (AINGS) adalah untuk mengoptimalkan proses penyuntingan dan pengiriman berita di era digital, dengan fokus khusus pada aspek usability layanan web dan efisiensi basis data. Proses pengembangan dimulai dengan pemetaan kebutuhan fungsional sistem de ngan fitur yang akan diimplementasi. Kebutuhan fungsional sistem mencakup pengelo laan draf berita, pembuatan draf berita dan validasi draf berita secara otomatis serta komu nikasi antara redaktur dan wartawan. Implementasi fitur diwujudkan dengan layanan web berupa REST API yang terintegrasi dengan basis data serta layanan web machine learn ing. Perancangan basis data dilakukan dengan melibatkan identifikasi empat entitas utama dan identifikasi hubungan antar entitas. Pengembangan basis data dilanjutkan dengan melakukan normalisasi hingga Third Normal Form (3NF) untuk memastikan konsistensi dari data yang disimpan serta efisiensi dalam waktu pemrosesan. Selain itu, dilakukan im plementasi Elasticsearch dan performanya dibandingkan dengan PostgreSQL dalam hal waktu pemrosesan untuk pencarian draf berita. Evaluasi layanan web dilakukan dengan melakukan integration testing dan evaluasi usability menggunakan heuristik. Hasil inte gration testing menunjukan layanan web lulus semua skenario tes dan mampu memenuhi seleuruh kebutuhan fungsional sistem. Berdasarkan hasil evaluasi heuristik, layanan web yang dikembangkan mencapai nilai metrik knowability (96.49%) dan robustness (100.00%) yang baik namun untuk metrik operability (84.07%) dan efficiency (83.33%) dapat ditingkatkan dengan memberikan opsi format data pada request dan menerapkan caching. Hasil evaluasi basis data menunjukan bahwa normalisasi pada tahap Second Normal Form (2NF) memberikan waktu pemrosesan yang lebih optimal dengan tetap memastikan konsistensi data yang terjaga. Rata-rata waktu pemrosesan yang dihasilkan oleh tahap 2NF adalah 1,712ms, sedangkan pada tahap 3NF mencapai 3,363ms. Semen tara itu, penerapan Elasticsearch meningkatkan kinerja pencarian sehingga menghasilkan waktu pemrosesan yang lebih cepat. Menggunakan kata kunci pencarian ”Jakarta”, Elas ticsearch dapat memproses permintaan hanya dalam waktu 8ms, sementara PostgreSQL membutuhkan waktu hingga 142,943ms

The objective of developing the ”Automatic Indonesian News Generation System” (AINGS) project is to optimize the editing and delivery process of news in the digital era, with a particular focus on the usability of web services and the efficiency of the database. The development process begins with mapping the system’s functional requirements to the features to be implemented. The functional requirements of the system include man aging news drafts, creating news drafts, and validating news drafts automatically, as well as communication between editors and reporters. The feature implementation is real ized through a web service in the form of a REST API integrated with a database and machine learning web services. The database design involves identifying four main en tities and the relationships between them. The database development is continued with normalization up to the Third Normal Form (3NF) to ensure consistency of the stored data and efficiency in processing time. Additionally, Elasticsearch is implemented, and its performance is compared with PostgreSQL in terms of processing time for searching news drafts. The web service evaluation is carried out by conducting integration testing and usability evaluation using heuristics. The integration testing results show that the web service passes all test scenarios and meets all the system’s functional requirements. Based on the heuristic evaluation results, the developed web service achieves good met rics in knowability (96.49%) and robustness (100.00%), but for operability (84.07%) and efficiency (83.33%) metrics, improvements can be made by providing data format options in requests and implementing caching. The database evaluation results show that normal ization at the Second Normal Form (2NF) stage provides more optimal processing time while ensuring data consistency. The average processing time produced by the 2NF stage is 1,712ms, while at the 3NF stage, it reaches 3,363ms. Meanwhile, the implementation of Elasticsearch enhances search performance, resulting in faster processing times. Us ing the search keyword ”Jakarta,” Elasticsearch can process requests in just 8ms, while PostgreSQL requires up to 142,943ms."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aprilian Tantra Luhur Achmad
"Tujuan dari pengembangan proyek Automatic Indonesian News Generation System (AINGS) adalah untuk mengoptimalkan proses penyuntingan dan pengiriman berita di era digital, dengan fokus khusus pada aspek usability layanan web dan efisiensi basis data. Proses pengembangan dimulai dengan pemetaan kebutuhan fungsional sistem de ngan fitur yang akan diimplementasi. Kebutuhan fungsional sistem mencakup pengelo laan draf berita, pembuatan draf berita dan validasi draf berita secara otomatis serta komu nikasi antara redaktur dan wartawan. Implementasi fitur diwujudkan dengan layanan web berupa REST API yang terintegrasi dengan basis data serta layanan web machine learn ing. Perancangan basis data dilakukan dengan melibatkan identifikasi empat entitas utama dan identifikasi hubungan antar entitas. Pengembangan basis data dilanjutkan dengan melakukan normalisasi hingga Third Normal Form (3NF) untuk memastikan konsistensi dari data yang disimpan serta efisiensi dalam waktu pemrosesan. Selain itu, dilakukan im plementasi Elasticsearch dan performanya dibandingkan dengan PostgreSQL dalam hal waktu pemrosesan untuk pencarian draf berita. Evaluasi layanan web dilakukan dengan melakukan integration testing dan evaluasi usability menggunakan heuristik. Hasil inte gration testing menunjukan layanan web lulus semua skenario tes dan mampu memenuhi seleuruh kebutuhan fungsional sistem. Berdasarkan hasil evaluasi heuristik, layanan web yang dikembangkan mencapai nilai metrik knowability (96.49%) dan robustness (100.00%) yang baik namun untuk metrik operability (84.07%) dan efficiency (83.33%) dapat ditingkatkan dengan memberikan opsi format data pada request dan menerapkan caching. Hasil evaluasi basis data menunjukan bahwa normalisasi pada tahap Second Normal Form (2NF) memberikan waktu pemrosesan yang lebih optimal dengan tetap memastikan konsistensi data yang terjaga. Rata-rata waktu pemrosesan yang dihasilkan oleh tahap 2NF adalah 1,712ms, sedangkan pada tahap 3NF mencapai 3,363ms. Semen tara itu, penerapan Elasticsearch meningkatkan kinerja pencarian sehingga menghasilkan waktu pemrosesan yang lebih cepat. Menggunakan kata kunci pencarian ”Jakarta”, Elas ticsearch dapat memproses permintaan hanya dalam waktu 8ms, sementara PostgreSQL membutuhkan waktu hingga 142,943ms

The objective of developing the ”Automatic Indonesian News Generation System” (AINGS) project is to optimize the editing and delivery process of news in the digital era, with a particular focus on the usability of web services and the efficiency of the database. The development process begins with mapping the system’s functional requirements to the features to be implemented. The functional requirements of the system include man aging news drafts, creating news drafts, and validating news drafts automatically, as well as communication between editors and reporters. The feature implementation is real ized through a web service in the form of a REST API integrated with a database and machine learning web services. The database design involves identifying four main en tities and the relationships between them. The database development is continued with normalization up to the Third Normal Form (3NF) to ensure consistency of the stored data and efficiency in processing time. Additionally, Elasticsearch is implemented, and its performance is compared with PostgreSQL in terms of processing time for searching news drafts. The web service evaluation is carried out by conducting integration testing and usability evaluation using heuristics. The integration testing results show that the web service passes all test scenarios and meets all the system’s functional requirements. Based on the heuristic evaluation results, the developed web service achieves good met rics in knowability (96.49%) and robustness (100.00%), but for operability (84.07%) and efficiency (83.33%) metrics, improvements can be made by providing data format options in requests and implementing caching. The database evaluation results show that normal ization at the Second Normal Form (2NF) stage provides more optimal processing time while ensuring data consistency. The average processing time produced by the 2NF stage is 1,712ms, while at the 3NF stage, it reaches 3,363ms. Meanwhile, the implementation of Elasticsearch enhances search performance, resulting in faster processing times. Us ing the search keyword ”Jakarta,” Elasticsearch can process requests in just 8ms, while PostgreSQL requires up to 142,943ms."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Hanif Anggawi
"Tujuan dari pengembangan proyek Automatic Indonesian News Generation System (AINGS) adalah untuk mengoptimalkan proses penyuntingan dan pengiriman berita di era digital, dengan fokus khusus pada aspek usability layanan web dan e siensi basis data. Proses pengembangan dimulai dengan pemetaan kebutuhan fungsional sistem de- ngan tur yang akan diimplementasi. Kebutuhan fungsional sistem mencakup pengelo- laan draf berita, pembuatan draf berita dan validasi draf berita secara otomatis serta komu- nikasi antara redaktur dan wartawan. Implementasi tur diwujudkan dengan layanan web berupa REST API yang terintegrasi dengan basis data serta layanan web machine learn- ing. Perancangan basis data dilakukan dengan melibatkan identi kasi empat entitas utama dan identi kasi hubungan antar entitas. Pengembangan basis data dilanjutkan dengan melakukan normalisasi hingga Third Normal Form (3NF) untuk memastikan konsistensi dari data yang disimpan serta e siensi dalam waktu pemrosesan. Selain itu, dilakukan im- plementasi Elasticsearch dan performanya dibandingkan dengan PostgreSQL dalam hal waktu pemrosesan untuk pencarian draf berita. Evaluasi layanan web dilakukan dengan melakukan integration testing dan evaluasi usability menggunakan heuristik. Hasil inte- gration testing menunjukan layanan web lulus semua skenario tes dan mampu memenuhi seleuruh kebutuhan fungsional sistem. Berdasarkan hasil evaluasi heuristik, layanan web yang dikembangkan mencapai nilai metrik knowability (96.49%) dan robustness (100.00%) yang baik namun untuk metrik operability (84.07%) dan ef ciency (83.33%) dapat ditingkatkan dengan memberikan opsi format data pada request dan menerapkan caching. Hasil evaluasi basis data menunjukan bahwa normalisasi pada tahap Second Normal Form (2NF) memberikan waktu pemrosesan yang lebih optimal dengan tetap memastikan konsistensi data yang terjaga. Rata-rata waktu pemrosesan yang dihasilkan oleh tahap 2NF adalah 1,712ms, sedangkan pada tahap 3NF mencapai 3,363ms. Semen- tara itu, penerapan Elasticsearch meningkatkan kinerja pencarian sehingga menghasilkan waktu pemrosesan yang lebih cepat. Menggunakan kata kunci pencarian ”Jakarta”, Elas- ticsearch dapat memproses permintaan hanya dalam waktu 8ms, sementara PostgreSQL membutuhkan waktu hingga 142,943ms.

The objective of developing the "Automatic Indonesian News Generation System" (AINGS) project is to optimize the editing and delivery process of news in the digital era, with a particular focus on the usability of web services and the ef ciency of the database. The development process begins with mapping the system’s functional requirements to the features to be implemented. The functional requirements of the system include man- aging news drafts, creating news drafts, and validating news drafts automatically, as well as communication between editors and reporters. The feature implementation is real- ized through a web service in the form of a REST API integrated with a database and machine learning web services. The database design involves identifying four main en- tities and the relationships between them. The database development is continued with normalization up to the Third Normal Form (3NF) to ensure consistency of the stored data and ef ciency in processing time. Additionally, Elasticsearch is implemented, and its performance is compared with PostgreSQL in terms of processing time for searching news drafts. The web service evaluation is carried out by conducting integration testing and usability evaluation using heuristics. The integration testing results show that the web service passes all test scenarios and meets all the system’s functional requirements. Based on the heuristic evaluation results, the developed web service achieves good met- rics in knowability (96.49%) and robustness (100.00%), but for operability (84.07%) and ef ciency (83.33%) metrics, improvements can be made by providing data format options in requests and implementing caching. The database evaluation results show that normal- ization at the Second Normal Form (2NF) stage provides more optimal processing time while ensuring data consistency. The average processing time produced by the 2NF stage is 1,712ms, while at the 3NF stage, it reaches 3,363ms. Meanwhile, the implementation of Elasticsearch enhances search performance, resulting in faster processing times. Using the search keyword ”Jakarta,” Elasticsearch can process requests in just 8ms, while Post- greSQL requires up to 142,943ms."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dimas Ilham Danesamarruf
"Jurnalisme modern memperketat persaingan dalam segi kecepatan penerbitan berita. Sementara itu, pembuatan berita sendiri melibatkan proses yang panjang dan penuh ketelitian. Hal ini menimbulkan dilema antara mengutamakan kecepatan pemberitaan atau kualitas berita. Imbasnya, sistematika penulisan berita tidak dijalankan dengan baik sehingga tidak sedikit media massa memberitakan hal tidak benar. Menyadari permasa- lahan tersebut, Automatic Indonesian News Generation System (AINGS) menghadirkan sebuah inovasi dengan mengembangkan Content Management System (CMS) berbasis web yang terintegrasi dengan kecerdasan buatan untuk membantu jurnalis dalam menulis dan melakukan veri kasi berita secara otomatis. Dengan fokus pada perancangan sistem dan implementasinya dalam bentuk front-end berbasis web, pengembangan ini mencoba menyelesaikan masalah yang lebih spesi k dengan membagi CMS AINGS menjadi dua bagian, yaitu CMS untuk wartawan dan CMS untuk redaktur. Wartawan dan redaktur dipilih menjadi aktor utama dalam sistem karena dua profesi tersebut terjun langsung dalam proses penulisan dan veri kasi berita. Pengembangan dilakukan dengan mener- apkan phased development methodology, mulai dari perencanaan, analisis, hingga system versioning. Melalui 3 iterasi, tujuan pengembangan berturut-turut antara lain MVP, kebu- tuhan pengguna, dan evaluasi pengguna. Berdasarkan hasil evaluasi akhir produk meng- gunakan metode UAT dan survei evaluasi penggunaan, kedua sistem dinilai sudah cukup memenuhi kebutuhan jurnalis, baik wartawan maupun redaktur, dalam membantu proses pembuatan berita.

Modern journalism has intensi ed competition in terms of speed of news publication, while news production itself involves a long and careful process. This creates a dilemma between prioritizing the speed of reporting or the quality of the news. As a result, the systematic of news writing are not carried out well so that quite a few media people re- port false news. Realizing this problem, Automatic Indonesian News Generation System (AINGS) presents an innovation by developing a web-based Content Management System (CMS) that is integrated with arti cial intelligence to assist journalists in writing and ver- ifying news automatically. By focusing on the system design and front-end of the AINGS system implementation, this development tries to solve speci c problems by dividing the AINGS CMS into two parts, namely CMS for reporter and CMS for editor. Reporter and editors were chosen to be the main actors in the system because these two professions are directly involved in the process of writing and verifying news. Development is carried out by implementing phased development methodology, starting from planning, analysis, to system versioning. Through 3 iterations, the development objectives in each iterations are for the MVP, ful lling user needs, and re ne based on user evaluations. Based on the results of the nal product evaluation using UAT method and system’s usage evaluation survey, the two systems were deemed suf cient to meet the needs of journalists, both re- porters and editors, in assisting the news creation process."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sulthan Afif Althaf
"Large Language Model (LLM) generatif merupakan jenis model machine learning yang dapat diaplikasikan dalam industri jurnalisme, khususnya dalam proses pembuatan dan validasi berita. Namun, LLM memerlukan sumber daya yang besar untuk operasionalnya serta membutuhkan waktu proses inferensi yang relatif lama. Penelitian ini bertujuan untuk mengembangkan layanan web machine learning yang memanfaatkan LLM generatif untuk proses pembuatan dan validasi berita. Tujuan lainnya adalah menciptakan sistem dengan mekanisme manajemen beban yang efisien untuk meminimalkan waktu inferensi. Pengembangan melibatkan beberapa tahap, yakni analisis kebutuhan stakeholder, perancangan desain dan arsitektur, implementasi, serta evaluasi. Dalam implementasi layanan web machine learning, pengembangan ini berfokus pada manajemen GPU untuk meningkatkan kecepatan proses inferensi LLM. Selain itu, dilakukan implementasi design pattern untuk meningkatkan skalabilitas dalam penambahan model machine learning. Untuk manajemen beban, dikembangkan dua mekanisme, yaitu load balancer dan scheduler. Implementasi load balancer memanfaatkan NGINX dengan metode round-robin. Sedangkan untuk scheduler, digunakan RabbitMQ sebagai antrean, dengan publisher menerima permintaan dan subscriber mendistribusikan permintaan ke layanan yang tersedia. Berdasarkan API Test, layanan ini berhasil melewati uji fungsionalitas dengan waktu respons API sekitar 1-2 menit per permintaan. Evaluasi performa pada kedua mekanisme manajemen beban menunjukkan tingkat keberhasilan 100%, dengan waktu respon rata-rata meningkat seiring dengan peningkatan jumlah request per detik. Pengelolaan beban dengan load balancer menghasilkan waktu respon yang lebih cepat, sementara pengelolaan beban dengan scheduler menghasilkan mekanisme yang lebih efektif pada proses koneksi asinkron.

Generative Large Language Model (LLM) is a type of machine learning model that can be applied in the journalism industry, especially in the process of news generation and validation. However, LLM requires large resources for its operation and requires a relatively long inference process time. This research aims to develop a machine learning web service that utilizes generative LLM for news generation and validation. Another goal is to create a system with an efficient load management mechanism to minimize inference time. The development involves several stages, namely stakeholder needs analysis, design and architecture, implementation, and evaluation. In the implementation of machine learning web services, this development focuses on GPU management to increase the speed of the LLM inference process. In addition, the implementation of design patterns is done to improve scalability in adding machine learning models. For load management, two mechanisms are developed: load balancer and scheduler. The load balancer implementation utilizes NGINX with the round-robin method. As for the scheduler, RabbitMQ is used as a queue, with the publisher receiving requests and the subscriber distributing requests to available services. Based on the API Test, the service successfully passed the functionality test with an API response time of about 1-2 minutes per request. Performance evaluation on both load management mechanisms showed a 100% success rate, with the average response time increasing as the number of requests per second increased. The use of a load balancer results in faster response times, while load management with a scheduler results in a more effective mechanism for asynchronous connection processes."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Fauzul Akbar
"Large Language Model (LLM) generatif merupakan jenis model machine learning yang dapat diaplikasikan dalam industri jurnalisme, khususnya dalam proses pembuatan dan validasi berita. Namun, LLM memerlukan sumber daya yang besar untuk operasionalnya serta membutuhkan waktu proses inferensi yang relatif lama. Penelitian ini bertujuan untuk mengembangkan layanan web machine learning yang memanfaatkan LLM generatif untuk proses pembuatan dan validasi berita. Tujuan lainnya adalah menciptakan sistem dengan mekanisme manajemen beban yang efisien untuk meminimalkan waktu inferensi. Pengembangan melibatkan beberapa tahap, yakni analisis kebutuhan stakeholder, perancangan desain dan arsitektur, implementasi, serta evaluasi. Dalam implementasi layanan web machine learning, pengembangan ini berfokus pada manajemen GPU untuk meningkatkan kecepatan proses inferensi LLM. Selain itu, dilakukan implementasi design pattern untuk meningkatkan skalabilitas dalam penambahan model machine learning. Untuk manajemen beban, dikembangkan dua mekanisme, yaitu load balancer dan scheduler. Implementasi load balancer memanfaatkan NGINX dengan metode round-robin. Sedangkan untuk scheduler, digunakan RabbitMQ sebagai antrean, dengan publisher menerima permintaan dan subscriber mendistribusikan permintaan ke layanan yang tersedia. Berdasarkan API Test, layanan ini berhasil melewati uji fungsionalitas dengan waktu respons API sekitar 1-2 menit per permintaan. Evaluasi performa pada kedua mekanisme manajemen beban menunjukkan tingkat keberhasilan 100%, dengan waktu respon rata-rata meningkat seiring dengan peningkatan jumlah request per detik. Pengelolaan beban dengan load balancer menghasilkan waktu respon yang lebih cepat, sementara pengelolaan beban dengan scheduler menghasilkan mekanisme yang lebih efektif pada proses koneksi asinkron.

Generative Large Language Model (LLM) is a type of machine learning model that can be applied in the journalism industry, especially in the process of news generation and validation. However, LLM requires large resources for its operation and requires a relatively long inference process time. This research aims to develop a machine learning web service that utilizes generative LLM for news generation and validation. Another goal is to create a system with an efficient load management mechanism to minimize inference time. The development involves several stages, namely stakeholder needs analysis, design and architecture, implementation, and evaluation. In the implementation of machine learning web services, this development focuses on GPU management to increase the speed of the LLM inference process. In addition, the implementation of design patterns is done to improve scalability in adding machine learning models. For load management, two mechanisms are developed: load balancer and scheduler. The load balancer implementation utilizes NGINX with the round-robin method. As for the scheduler, RabbitMQ is used as a queue, with the publisher receiving requests and the subscriber distributing requests to available services. Based on the API Test, the service successfully passed the functionality test with an API response time of about 1-2 minutes per request. Performance evaluation on both load management mechanisms showed a 100% success rate, with the average response time increasing as the number of requests per second increased. The use of a load balancer results in faster response times, while load management with a scheduler results in a more effective mechanism for asynchronous connection processes. "
Depok: Fakultas Ilmu Komputer Universitas Indonesia , 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rizky Juniastiar
"Kebutuhan akan informasi yang cepat dan valid semakin mendesak di tengah arus in- formasi yang cepat. Kemajuan teknologi memberikan dampak signi kan terhadap in- dustri jurnalisme untuk mengakomodasi kebutuhan informasi tersebut. Proses produksi berita, yang tradisionalnya memakan waktu, terus dihadapkan pada tuntutan untuk meng- hasilkan informasi dengan cepat dan akurat. Penelitian ini merespon tantangan terse- but dengan melakukan pengembangan model generatif yang dapat melakukan pembuatan berita secara otomatis. Dalam pengembangan model generatif, penulis melakukan bebe- rapa skenario percobaan untuk menguji pengaruh ukuran jumlah parameter, jenis prompt- ing, dan penggunaan delimiter pada prompt yang digunakan terhadap kualitas model yang dihasilkan. Percobaan dilakukan dengan melakukan ne tuning pada dua buah large language model yang memiliki arsitektur berbeda, yaitu Falcon dan BLOOM. Pengem- bangan large language model selanjutnya dilakukan proses evaluasi dengan menggunakan metrik measurement BLEU, ROUGE, perplexity, dan human evaluation kepada wartawan terhadap berita yang dihasilkan. Hasil yang penulis dapatkan menunjukkan bahwa terda- pat beberapa aspek yang memengaruhi kualitas berita yang dihasilkan oleh model dalam proses ne tuning. Beberapa aspek tersebut di antaranya adalah ukuran jumlah parameter, jenis prompting, dan penggunaan delimiter pada prompt yang digunakan. Model terbaik yang didapatkan dari keseluruhan model percobaan adalah BLOOM dengan jumlah pa- rameter 7B yang mendapatkan hasil evaluasi ROUGE-1 sebesar 0,3856 dan perplexity sebesar 5,79809. Model ini juga dapat menghasilkan berita yang sesuai dengan kebu- tuhan wartawan dalam proses human evaluation, baik dari kesesuaian dengan kaidah ke- bahasaan dan penulisan berita maupun ketepatan berita dengan fakta sebenarnya. Model ini mendapatkan penilaian sebesar 4,25 dari 5,00 untuk kesesuaian dengan kaidah keba- hasaan dan 4,27 dari 5,00 untuk ketepatan dengan fakta sebenarnya.

The escalating need for swift and accurate information in today's dynamic information landscape poses a significant challenge. Technological advancements have profoundly impacted the journalism industry, necessitating adaptations to fulfill evolving information requirements. The traditional, time-consuming news production process is under constant pressure to deliver information swiftly and accurately. This research tackles these challenges by developing a generative model capable of automating news creation. The author explores various experimental scenarios in the generative model development, investigating the influence of parameters' quantity, prompting techniques, and the use of delimiters in prompts on the resulting model's quality. The experiments involve fine-tuning two large language models with different architectures, Falcon and BLOOM. The subsequent evaluation process utilizes metrics such as BLEU, ROUGE, perplexity, and human evaluation by journalists to assess the quality of the generated news. The findings underscore that several factors, including parameter quantity, prompting techniques, and delimiter use, impact the news model's quality during the fine-tuning process. Significantly, among the experimented models, the BLOOM model with 7B parameters emerges as the overall best performer. This model achieves a ROUGE-1 evaluation of 0.38656 and a perplexity of 5.79809. In human evaluation, the BLOOM model excels in linguistic adherence and factual accuracy, receiving ratings of 4,25 out of 5.00 and 4,27 out of 5.00, respectively."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fakultas Teknik Universitas Indonesia, 2005
TA3096
UI - Tugas Akhir  Universitas Indonesia Library
cover
Bai, Ying
New Jersey: John Wiley & Sons, 2011
005.13 BAI p
Buku Teks SO  Universitas Indonesia Library
cover
Mohammad Salman Alfarisi
"

Salah satu permasalahan yang terdapat pada sistem Automatic Speech Recognition (ASR) yang sudah ada adalah kurangnya transparansi dalam penanganan data suara, yang tentunya membuat adanya keraguan terhadap privasi data tersebut. Di sisi lainnya, untuk mengembangkan sebuah sistem ASR yang memiliki akurasi memadai dan dapat bekerja secara luring membutuhkan jumlah data yang banyak, khususnya data suara yang sudah diiringi dengan transkripnya. Hal ini menjadi salah satu hambatan utama pengembangan sistem pengenalan suara, terutama pada yang memiliki sumber daya minim seperti Bahasa Indonesia. Oleh karena itu, dalam penelitian ini dilakukan perancangan sistem pengenalan suara otomatis berbasis model wav2vec 2.0, sebuah model kecerdasan buatan yang dapat mengenal sinyal suara dan mengubahnya menjadi teks dengan akurasi yang baik, meskipun hanya dilatih data dengan label yang berjumlah sedikit. Dari pengujian yang dilakukan dengan dataset Common Voice 8.0, model wav2vec 2.0 menghasilkan WER sebesar 25,96%, dua kali lebih baik dibandingkan dengan model Bidirectional LSTM biasa yang menghasilkan 50% namun membutuhkan jumlah data dengan label 5 kali lipat lebih banyak dalam proses pelatihan. Namun, model wav2vec membutuhkan sumber daya komputasi menggunakan 2 kali lebih banyak RAM dan 10 kali lebih banyak memori dibandingkan model LSTM


One of the main problems that have plagued ready-to-use Automatic Speech Recognition (ASR) Systems is that there is less transparency in handling the user’s voice data, that has raised concerns regarding the privacy of said data. On the other hand, developing an ASR system from scratch with good accuracy and can work offline requires a large amount of data, more specifically labeled voice data that has been transcribed. This becomes one of the main obstacles in speech recognition system development, especially in low-resourced languages where there is minimal data, such as Bahasa Indonesia. Based on that fact, this research conducts development of an automatic speech recognition system that is based on wav2vec 2.0, an Artificial Model that is known to recognize speech signals and convert it to text with great accuracy, even though it has only been trained with small amounts of labeled data. From the testing that was done using the Common Voice 8.0 dataset, the wav2vec 2.0 model produced a WER of 25,96%, which is twice as low as a traditional Bidirectional LSTM model that gave 50% WER, but required 5 times more labeled data in the training process. However, the wav2vec model requires more computational resource, which are 2 times more RAM and 10 times more storage than the LSTM model.

"
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>