Publications | Wenyan Li

RAVENEA: A Benchmark for Multimodal Retrieval-Augmented Visual Culture Understanding

Jiaang Li, Yifei Yuan, Wenyan Li, Mohammad Aliannejadi, Daniel Hershcovich, Anders Søgaard, Ivan Vulić, Wenxuan Zhang, Paul Pu Liang, Yang Deng, Serge Belongie

Lost in Embeddings: Information Loss in Vision-Language Models

Wenyan Li, Raphael Tang, Chengzu Li, Caiqi Zhang, Ivan Vulić, Anders Søgaard

Words Worth a Thousand Pictures: Measuring and Understanding Perceptual Variability in Text-to-Image Generation

Raphael Tang, Crystina Zhang, Lixinyu Xu, Yao Lu, Wenyan Li, Pontus Stenetorp, Jimmy Lin, Ferhan Ture

FoodieQA: A Multimodal Dataset for Fine-Grained Understanding of Chinese Food Culture

Wenyan Li, Xinyu Zhang, Jiaang Li, Qiwei Peng, Raphael Tang, Li Zhou, Weijia Zhang, Guimin Hu, Yifei Yuan, Anders Søgaard, Daniel Hershcovich, Desmond Elliott

Understanding Retrieval Robustness for Retrieval-Augmented Image Captioning

Wenyan Li, Jiaang Li, Rita Ramos, Raphael Tang, Desmond Elliott

The Role of Data Curation in Image Captioning

Wenyan Li, Jonas F Lotz, Chen Qiu, Desmond Elliott

MAP: Low-data Regime Multimodal Learning with Adapter-based Pre-training and Prompting

Wenyan Li, Dong Li, Wanjing Li, Yuanjie Wang, Hai Jie, Yiran Zhong

Systems and Methods for Training Voice Query Models

Wenyan Li, Ferhan Ture, Jose Casillas, Tom Des Jardins

Auto-annotation for Voice-enabled Entertainment Systems

Wenyan Li, Ferhan Ture

An Attentive Recurrent Model for Incremental Prediction of Sentence-final Verbs

Wenyan Li, Alvin Grissom II, Jordan Boyd-Graber