Personnel

Corpus bilingue pashto-français


Description :

Ce corpus est divisé en deux partie : La premiere compte 5737 traductions d’entités nommées (nom de personnes et de villes) et la deuxième contient 737 conversations usuelles en langue pashto ainsi que leurs traductions françaises.

Téléchargement :

Corpus1
Corpus2

Publication :

Please cite this reference if you use these data in your research work :
Fethi Bougares, Anthony Rousseau, Paul Deléglise, Yannick Estève, Loïc Barrault, Holger Schwenk, Sylvie Brunessaux, Khaled Khelif, Mathieu Manta.
Développement et évaluation d’un système de traduction automatique de la parole en Pashto vers le Français. JEP 2014, Le Mans(France) 2014.



TARIC : Corpus des enregistrements audio manuellement transcrits en dialect Tunisien


Description :

TARIC is a freely distributed transcribed speech corpora for Tunisian dialect.
This corpus is distributed as a package available for research purposes including :

Téléchargement :

Audios (sph)
Transcription (trs)
Lexique (txt)
Outil G2P (script)
Correspondance G2P (xls)


Laboratoire d'Informatique de l'Université du Maine (LIUM)
Institut d'Informatique Claude Chappe
Université du Maine, Avenue Laënnec
72085 LE MANS CEDEX 9
$