Publications

Acoustic Word Embeddings for Untranscribed Target Languages with Continued Pretraining and Learned Pooling

Ramon Sanabria Ondrej Klejch, Hao Tang, and Sharon Goldwater

Interspeech 2023

The Edinburgh International Accents of English Corpus: Towards the Democratization of English ASR

Ramon Sanabria Nikolay Bogoychev, Nina Markl, Andrea Carmantini, Ondrej Klejch, and Peter Bell

ICASSP 2023 [Paper] [Web page]

Analyzing Acoustic Word Embeddings from Pre-trained Self-supervised Speech Models

Ramon Sanabria, Hao Tang, and Sharon Goldwater

ICASSP 2023 [Paper]

Measuring the Impact of Individual Domain Factors in Self-Supervised Pre-Training

Ramon Sanabria, Wei-Ning Hsu, Alexei Baevski, and Michael Auli

ICASSP 2023 (SASB) [Paper]

On the Difficulty of Segmenting Words with Attention

Ramon Sanabria, Hao Tang, and Sharon Goldwater

Insights from Negative Results in NLP (EMNLP 2021). Punta Cana, Dominican Republic [Paper]

Talk, Don't Write: A Study of Direct Speech-Based Image Retrieval

Ramon Sanabria*, Austin Waters*, and Jason Baldridge

Interspeech 2021. Brno, Czech Republic [Paper] [Video]

Transfer Learning For Multimodal Dialog

Shruti Palaskar, Ramon Sanabria, and Florian Metze

Computer Speech & Language [Paper]

Multimodal Speech Recognition with Unstructured Audio Masking

Tejas Srinivasan, Ramon Sanabria, Florian Metze, and Desmond Elliott

NLP Beyond Text, EMNLP 2020. Online [Paper]

Fine-grained Grounding for Multimodal Speech Recognition

Tejas Srinivasan, Ramon Sanabria, Florian Metze, and Desmond Elliott

Findings of EMNLP 2020. Online [Paper]

Grounded Sequence to Sequence Transduction

Lucia Specia, Raman Arora, Loic Barrault, Ozan Caglayan, Amanda Duarte, Desmond Elliott, Spandana Gella, Nils Holzenberger, Chiraag Lala, Sun Jae Lee, Jindrich Libovicky, Pranava Madhyastha, Florian Metze, Karl Mulligan, Alissa Ostapenka, Shruti Palaskar, Ramon Sanabria, and Josiah Wang

IEEE Journal of Selected Topics in Signal Processing [Paper]

Looking Enhances Listening: Recovering Speech Using Images

Tejas Srinivasan, Ramon Sanabria, and Florian Metze

ICASSP 2020. Barcelona <3. [Paper] [Talk]

The IWSLT 2019 Evaluation Campaign

Jan Niehues, Roldano Cattoni, Sebastian Stüker, Matteo Negri, Marco Turchi, Thanh-Le Ha, Elizaberh Salesky, Ramon Sanabria, Loïc Barrault, Lucia Specia, and Marcello Federico

EMNLP, IWSLT 2019. Hong Kong. [Paper]

Multitask Learning For Different Subword Segmentations In NMT

Tejas Srinivasan, Ramon Sanabria, and Florian Metze

EMNLP, IWSLT 2019. Hong Kong. [Paper]

CMU Sinbad's Submission for the DSTC7 AVSD Challenge

Ramon Sanabria, Shruti Palaskar, and Florian Metze

AAAI 2019. Honolulu, USA. [Paper]

Multimodal Grounding For Sequence-To-Sequence ASR

Ozan Caglayan, Ramon Sanabria, Shruti Palaskar, Loïc Barrault, and Florian Metze

ICASSP 2019. Brighton, UK. [Paper]

How2: A Large-scale Dataset for Multimodal Language Understanding

Ramon Sanabria, Ozan Caglayan, Shruti Palaskar, Desmond Elliott, Loïc Barrault, Lucia Specia, and Florian Metze

NeurIPS 2018 Workshop. Montreal, Canada. [Paper]

Hierarchical Multi Task Learning With CTC

Ramon Sanabria and Florian Metze

SLT 2018. Athens, Greece. [Paper]

Subword and Crossword Units for CTC Acoustic Models

Thomas Zenkel, Ramon Sanabria, Florian Metze and Alex Waibel

Interspeech 2018. Hyderabad, India. [Paper]

End-to-End Multimodal Speech Recognition

Shruti Palaskar, Ramon Sanabria and Florian Metze

ICASSP 2018. Calgary, Alberta, Canada. [Paper]

Sequence-based Multi-lingual Low Resource Speech Recognition

Siddharth Dalmia, Ramon Sanabria, Florian Metze and Alan W. Black

ICASSP 2018. Calgary, Alberta, Canada. [Paper]

Comparison of Decoding Strategies for CTC Acoustic Models

Thomas Zenkel, Ramon Sanabria, Florian Metze, Jan Niehues, Matthias Sperber, Sebastian Stüker and Alex Waibel

Interspeech 2017. Stockholm, Sweden. [Paper]