Multilingual Multimodal Machine Translation for Dravidian Languages utilizing Phonetic Transcription

Bharathi Raja Chakravarthi; Ruba Priyadharshini; Bernardo Stearns; Arun Jayapal; S Srivedy; Mihael Arcan; Manel Zarrouk; John P. McCrae

doi:10.18653/v1/w19-6809

Published August 20, 2019 | Version v1

Conference paper Open

Multilingual Multimodal Machine Translation for Dravidian Languages utilizing Phonetic Transcription

1. National University of Ireland Galway
2. Saraswathi Narayanan College
3. Smart Insights from Conversations
4. Tamil Nadu Agricultural University

Multimodal machine translation is the task of translating from source language to target language using information from other modalities. Existing multimodal datasets have been restricted to only highly resourced languages. These datasets were collected by manual translation of English descriptions from the Flickr30K dataset. In this work, we introduce MMDravi, a Multilingual Multimodal dataset for under-resourced Dravidian languages. It comprises of 30K sentences which were created utilizing several machine translation outputs. Using data from MMDravi and a phonetic transcription of the corpus, we build an MMNMT system for closely related Dravidian languages to take advantage of multilingual corpus and other modalities. We evaluate our MMNMT translations generated by the proposed approach with human annotated evaluation tests in terms of BLEU, METEOR, and TER. Relying on multilingual corpora, phonetic transcription, and image features, our approach improves the translation quality for the under-resourced languages.

Files

chakravarthi2019multilingual.pdf

Files (761.5 kB)

Name	Size	Download all
chakravarthi2019multilingual.pdf md5:f22665a81a60e7c21c646f106b5e3376	761.5 kB	Preview Download

Additional details

European Commission
ELEXIS - European Lexicographic Infrastructure 731015

	All versions	This version
Views	271	270
Downloads	133	133
Data volume	111.9 MB	111.9 MB

Multilingual Multimodal Machine Translation for Dravidian Languages utilizing Phonetic Transcription

Authors/Creators

Description

Files

chakravarthi2019multilingual.pdf

Files (761.5 kB)

Additional details

Funding