Travaux de recherche à Orange Labs

Travaux de recherche de Malek Boualem à France Telecom Orange Labs

Traduction automatique

J’ai réalisé un état de l’art riche et assez exhaustif des systèmes de traduction automatique existants sur le marché (caractéristiques, fournisseurs, tarifs, etc.). Cet état de l’art inclut également les systèmes prototypes ou les travaux de recherche en cours dans le domaine de la traduction automatique.  Cette étude est disponible sur le site Intranet.

Encadrement d’une thèse en traduction automatique

J’ai assuré l’encadrement d’une thèse en informatique dans le domaine de la traduction automatique, en collaboration avec le Professeur J.Véronis de l’université de Provence. La soutenance de cette thèse a eu lieu le 8 décembre 2006. Cette thèse a permis de mettre en place un système prototype de traduction automatique de troisième génération (utilisation d’une structure sémantique intermédiaire).

Génération automatique en langage naturel

Notre équipe a démarré une activité en génération automatique de texte en langage naturel sur la base des outils d’analyse linguistique déjà en place. Pour cela, un ingénieur apprenti a travaillé, sous ma responsabilité, dans notre équipe en 2001/2002. Il a travaillé sur la mise en place d’un module de génération morphologique (flexionnelle) et d’un module de génération syntaxique.

Traduction automatique sur terminaux mobiles

J’ai encadré un projet de recherche (TRANSAT ou Translation of Speech and Text / 2004-2007) qui a permis de mettre en place un prototype de traduction sur terminaux mobiles intégrant plusieurs modalités : traduction de l’écrit, traduction par choix dans un livre de phrases et traduction de l’oral. Ce projet nous avait permis de coupler finement la reconnaissance de la parole et la traduction automatique à base de règles et également statistique.

Traduction automatique de SMS

Une des émanations du projet TRANSAT a été de mettre en place un prototype de traducteur de SMS sur terminaux mobiles (OMTS ou Orange Mobile Translation Service). Ce prototype intègre notamment une technologie d’interprétation de l’écriture de type SMS.

Traitement automatique de la langue arabe

J’ai participé activement au lancement de l’activité de traitement automatique de la langue arabe. Parmi les actions menées :

  • Prospection pour l’acquisition d’un lexique arabe (étude approfondie et exhaustive de l’offre au niveau mondial, identification d’un fournisseur, discussions, rencontres et acquisition du lexique).
  • Recrutement de deux Post-Doc spécialisés en traitement automatique de la langue arabe : la rareté de ce type de profil a été à l’origine d’une grande difficulté pour trouver de bons candidats.
  • Construction d’une table de translittération des caractères arabes. Nous avions même étudié la possibilité de proposer cette table aux organismes de normalisation.

Internationalisation et localisation des applications et des services

Cette activité concerne les applications et les services de France Télécom qui sont destinés à un marché international.  La dimension internationale, qui est de plus en plus prononcée au sein du groupe France Télécom, se traduit nécessairement par des besoins en localisation des applications qui sont destinées au marché international.  L’objectif de cette activité est de mettre à la disposition des unités du groupe, qui sont des développeurs d’applications ou des offreurs de services, une plate forme experte pour la localisation de leurs produits dans les langues du marché cible.

Extraction d’informations

Durant les trois années précédentes, j’ai piloté des projets de recherche sur le thème de l’extraction d’informations (notamment les entités nommées et les relations entre entités nommées).

Besttips |
Howtotips |
majukabeh |
Unblog.fr | Créer un blog | Annuaire | Signaler un abus | Mamhung
| Software Testing
| Cheapproduct