Concept-Map Visual Encoder Actor-Critic Reinforcement Learning with Visual-Semantic Embedding-Based Reward for Image Captioning = Concept-Map Visual Encoder Actor-Critic Reinforcement Learning dengan berbasis Visual-Semantic Embedding Reward untuk Image Captioning

Lintang Adyuta Sutawika, author

Concept-Map Visual Encoder Actor-Critic Reinforcement Learning with Visual-Semantic Embedding-Based Reward for Image Captioning = Concept-Map Visual Encoder Actor-Critic Reinforcement Learning dengan berbasis Visual-Semantic Embedding Reward untuk Image Captioning

Lintang Adyuta Sutawika; Mohamad Ivan Fanany, supervisor; Rahmad Mahendra, supervisor; Aniati Murni Arymurthy, examiner; Marsh, Kris; Denny, examiner (Fakultas Ilmu Komputer Universitas Indonesia, 2019)

Abstrak

Karya ini menggunakan encoder visual berbasis Concept-Map yang menanggulangi masalah penghubungan informasi dari citra yang telah di-encode oleh sebuah jaringan saraf tiruan konvolusional ke dalam ranah semantik yang diproses oleh jarinagn saraf tiruan berbasis waktu. Pendekatan ini menggunakan komponen attention visual yang mengembangkan jaringan konvolusional sebelum dipropagasi ke jaringan berbasis waktu. Untuk meningkatkan pembelajaran cross-entropy, model dilatih dengan metode reinforcement learning dengan cara melatih value dan policy network berdasarkan jarak visual-semantic embedding distance dari representasi vector sebagai sinyal reward. Visual-semantic embedding space belajar dan menghasilkan vector space untuk citra dan teks, lalu digunakan sebagai tolak ukur qualitas suatu teks yang mendeskripsikan suatu citra. Sinyal reward membantu mengarahkan dan memaksimalkan probabilitas suatu deskripsi bagus muncul. Dataset yang digunakan adalah Flickr8k dan metric yang dilaporkan adalah BLEU-1 hingga BLEU-4

This work features a Concept-Map visual encoder that tackles the issue of linking encoded image information from convolutional neural networks to semantic domain processed by recurrent neural networks. The approach utilizes visual attention that extends the convolutional network before being propagated to through the recurrent network. To improve upon cross entropy learning, the model is then trained on reinforcement learning by training a value and policy network on visual-semantic embedding distance of vector representations as reward signals. The visual-semantic embedding space that jointly learns a common vector space for encoding image and caption is used to measure the quality of generated caption computing how close the vector representation is to the vector representation of the input image. The reward signal guides the policy to maximize the probability of producing good captions. The Flickr8K dataset is used and BLEU-1 to BLEU-4 for is reported.

File Digital: 1

Shelf

T-Lintang Adyuta Sutawika.pdf :: Unduh

LOGIN required

Kata Kunci

deep learning

reinforcement learning

convolutional neural network

recurrent neural network

Metadata

No. Panggil :	T-pdf
Entri utama-Nama orang :	Lintang Adyuta Sutawika, author


Entri tambahan-Nama orang :	Mohamad Ivan Fanany, supervisor Rahmad Mahendra, supervisor Aniati Murni Arymurthy, examiner Marsh, Kris, author Denny, examiner
Entri tambahan-Nama badan :	Universitas Indonesia. Fakultas Ilmu Komputer

Subjek :	Deep learning Reinforcement learning
Penerbitan :	Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019
Program Studi :	Ilmu Komputer

Bahasa :	eng
Sumber Pengatalogan :	LibUI eng rda
Tipe Konten :	text
Tipe Media :	computer
Tipe Carrier :	online resource (rdcarrier)
Deskripsi Fisik :	xii, 39 pages : illustration
Naskah Ringkas :
Lembaga Pemilik :	Universitas Indonesia
Lokasi :	Perpustakaan UI

Ketersediaan
Ulasan

No. Panggil	No. Barkod	Ketersediaan
T-pdf	15-23-46377805	TERSEDIA

Ulasan:

Tidak ada ulasan pada koleksi ini: 20522366

:: UI - Tesis Membership :: Kembali

UI - Tesis Membership :: Kembali

Concept-Map Visual Encoder Actor-Critic Reinforcement Learning with Visual-Semantic Embedding-Based Reward for Image Captioning = Concept-Map Visual Encoder Actor-Critic Reinforcement Learning dengan berbasis Visual-Semantic Embedding Reward untuk Image Captioning

Abstrak

File Digital: 1

LOGIN required

Kata Kunci

Metadata