Introduction aux systèmes de traduction basés sur les séquences de mots hiérarchiques

Date: 
09/03/2010
Heure: 
11h00
Orateur: 
Estève, Y.
Laboratoire: 
LIUM
Groupe: 
équipe Parole/Traduction
Résumé du séminaire: 
Les systèmes de traduction probabilistes les plus performants actuellement sont les systèmes qui utilisent comme unité de traduction des séquences de mots (phrases). Ces systèmes sont des évolutions de systèmes antérieurs utilisant les mots comme unité de traduction. Les systèmes basés sur les séquences de mots, comme Moses, utilisent des tables de correspondances (phrase-tables) entre séquences du langage source et séquences du langage cible, correspondances construites à partir d'alignements automatiques basées sur des approches statistiques. Depuis peu, Joshua, un système de traduction basé sur des séquences de mots hiérarchiques (hierarchical phrases), est disponible sous licence open source et obtient des performances similaires à celles des systèmes établis. Il utilise les mêmes alignements de base que les systèmes basés sur des séquences de mots conventionnelles pour construire des séquences de mots hiérarchiques, et remplace la table de correspondances par une grammaire hors-contexte synchrone. Cette présentation sera une courte introduction aux fondements de Joshua, à savoir les séquences de mots hiérarchiques, modélisées sous forme de grammaires hors-contexte synchrones. Quelques éléments d'utilisation de Joshua dans le cadre de la campagne IWSLT seront présentés.
PDF 1: 
http://lium3.univ-lemans.fr/lium_d5/sites/default/files/YEsteve_09032010_TradHierarchique.pdf