Segmentation thématique, Analyse automatique de la parole dans les flux audio

Date: 
21/02/2013
Heure: 
15h00
Orateur: 
Bouchekif, A.
Laboratoire: 
OrangeLabs
Résumé du séminaire: 
La segmentation thématique d’émissions télévisées consiste à localiser les changements de thèmes (ce qui permet par exemple à un utilisateur de visualiser rapidement les sujets traités durant une émission). Notre algorithme de segmentation non-supervisé est basé sur un calcul de cohésion lexicale à partir de la transcription automatique. La détection de frontières thématiques à partir de la cohésion lexicale est réalisée à l’aide d’une méthode dérivée de l’algorithme TextTiling. Dans le cas particulier des journaux télévisés, nous avons développé plusieurs méthodes visant à exploiter la détection du locuteur principal : comme citère complémentaire dans l’approche non-supervisée ou comme feature avec des outils d’apprentissage (CRF++, icsiboost) pour mieux affiner le processus de segmentation.
PDF 1: 
http://www-lium.univ-lemans.fr/sites/default/files/presentation_Abdessalam_210213.pdf