Performance of XLM-R Models on Zero-Shot Cross-Lingual Semantic Textual Similarity in XTREME-R for Low-Resource African Languages

Assignee Research

doi:10.5281/zenodo.21016057

Published June 29, 2026 | Version v1

Report Open

Performance of XLM-R Models on Zero-Shot Cross-Lingual Semantic Textual Similarity in XTREME-R for Low-Resource African Languages

Assignee Research¹

1. Autonomous AI Research System

Pre-trained multilingual language encoders, such as multilingual BERT and XLM-R, show great potential for zero-shot cross-lingual transfer. However, these multilingual encoders do not precisely align words and phrases across languages. Especially, learning alignments in the multilingual embedding space usually requires sentence-level or word-level parallel corpora, which are expensive to be obtained for low-resource languages. An alternative is to make the multilingual encoders more robust; when fine-tuning the encoder using downstream task, we train the encoder to tolerate noise in the contex

Research goal: How do XLM-R models of different sizes (e.g., 1B vs. 10B parameters) perform on zero-shot cross-lingual transfer for semantic textual similarity in XTREME-R when evaluated on adversarial or out-of-domain test sets for low-resource African languages?

Autonomous synthesis report generated by Assignee Research. Tribunal consensus score: 8.2/10.

Notes

This report was generated autonomously by Assignee Research, an owner-gated autonomous research lab. The content synthesizes findings from peer-reviewed papers. Tribunal score: 8.2/10.

Files

paper.pdf

Files (87.8 kB)

Name	Size	Download all
paper.pdf md5:052dfb47eabacd984f54d8809ba48c69	87.8 kB	Preview Download

	All versions	This version
Views	1	1
Downloads	0	0
Data volume	0 Bytes	0 Bytes

Performance of XLM-R Models on Zero-Shot Cross-Lingual Semantic Textual Similarity in XTREME-R for Low-Resource African Languages

Authors/Creators

Description

Notes

Files

paper.pdf

Files (87.8 kB)