http://www.aulf.org/blog/index.htm Association des Universitaires Libanais en France

vendredi 20 novembre 2009

[Blog] [Fwd: [asr-forum] Offre de thèse CIFRE : Compilation d'unités phono-lexicales du langage parlé]

Proposition de Thèse CIFRE en informatique : Compilation d'unités

phono-lexicales du langage parlé.

Cette thèse s'inscrit dans le cadre d'un projet de réalisation d'un
système logiciel permettant, notamment, l'apprentissage de l'écriture à
partir de l'expression orale, la correction automatique d'erreurs
orthographiques et grammaticales, et l'indexation sémantique de textes.
Ce projet allie des chercheurs en phonétique, en linguistique (syntaxe
et sémantique intrinsèque) et en informatique (compilation et
optimisation de codes).

L'approche adoptée consiste à considérer que l'écriture implique la
primauté de la substance phonique (les sons, les syllabes) et que de ce
fait, il faut concevoir un modèle unitaire d'emblée établi sur le
couplage entre le système phonologique, caractérisé par la variabilité
des sons, et le système grammatical, caractérisé par la stabilité des
unités graphiques. On fait donc l'hypothèse méthodologique que ce
couplage est représentable dans la partie frontale d'un compilateur via
les procédures de gestion de la table des symboles et de gestion des
erreurs liées aux niveaux de l'analyse phono-lexicale, de l'analyse
syntaxique et de l'analyse sémantique.

Au niveau phonique, la définition des unités lexicales implique de
traiter simultanément l'intonation, l'accentuation, les syllabes et les
phonèmes, pour segmenter la chaîne en mots phonologiques, représentables
par des symboles. Le passage à l'écrit exige ainsi une méthode de
construction récursive des unités à différents niveaux d'analyse par la
formulation de règles d'inférences qui font correspondre les unités de
niveau phonologique et les unités de niveau grammatical : la définition
des unités au niveau phonologique est simultanément élaborée et couplée
avec celle des unités grammaticales constituant l'énoncé selon une
méthode descendante. D'où l'hypothèse de la hiérarchie des unités : une
unité grammaticale est une structure relationnelle construite
d'attributs atomiques définis par la hiérarchie d'une grammaire formelle.

Chaque unité lexicale peut jouer plusieurs rôles différents, selon le
contexte de son apparition, contrairement aux unités lexicales des
langages de programmation. Le type qui lui est associé est donc
multiple. Par exemple « sort » peu jouer le rôle de verbe ou de nom
commun, selon sa place
dans la phrase analysée. Cette place ne peut être identifiée qu'à
l'étape d'analyse syntaxique, par confrontation avec les règles de
production de la grammaire.

Le processus de compilation doit ensuite servir à extraire l'information
de la sémantique du texte analysé, celle-ci devant être exprimée par une
syntaxe « élémentaire » d'arbres de syntaxe abstraite étiquetés par des
attributs.

Le modèle d'analyse descendante de la phrase, qui permet en effet de
contrôler la génération et l'analyse de phrases de complexité
croissante, servira de modèle à la constitution d'une base de données
relationnelle constituée de tables reliées aux attributs des unités de
sens. Les champs des tables représenteront les opérations sur les unités
(substitution, déplacement, ajout, réduction).

Ce travail de thèse s'effectuera en collaboration avec l'Université de
Strasbourg et l'entreprise Digora à Strasbourg, partenaire Oracle. Côté
université, l'étudiant sera encadré par Rudolph Sock (phonéticien),
Gérard Reb (linguiste) et Philippe Clauss (informaticien). L'étudiant
alternera des périodes de travail en laboratoire (laboratoire LSIIT -
Strasbourg) et en entreprise. Le travail de thèse pourra débuter dès
l'accomplissement de la procédure administrative d'établissement de la
convention CIFRE pour une durée de 3 ans. Le salaire minimum est de 23
484 € annuel brut.

Prendre contact avec Philippe Clauss (clauss@unistra.fr)

Liens :
Laboratoire LSIIT : http://www-lsiit.u-strasbg.fr
Digora : http://www.digora.com
Université de Strasbourg : http://www.unistra.fr
Dispositif CIFRE : http://www.anrt.asso.fr/fr/espace_cifre/accueil.jsp


_______________________________________________
Blog mailing list
Blog@aulf.org
http://lists.aulf.org/cgi-bin/mailman/listinfo/blog

0 commentaires:

Enregistrer un commentaire



<$I18N$LinksToThisPost>:

Créer un lien

<< Accueil