Ce site a pour vocation de présenter le projet dans son ensemble, ses acteurs et ses réalisations.
L’équipe Morphophonologie du Laboratoire Ligérien de Linguistique (UMR 7270) a initié en 2009 le projet de constitution d’une base de données dictionnairique sur la prononciation de l’anglais contemporain, à partir de l’exploitation des bases de données de trois dictionnaires majeurs, le Longman Pronunciation Dictionary (3ème édition), le Cambridge English Pronouncing Dictionary (17ème édition), et le dictionnaire de référence de l’anglais australien, Macquarie Dictionary (4ème édition), mises à disposition du laboratoire après accord avec les éditeurs. Construite sous forme de base de données relationnelle, l’équipe ambitionnait en outre de compléter les informations de ces dictionnaires, en particulier les deux premiers, notamment dans les domaines de la morphologie, la lexicologie, la syntaxe et la sémantique.
Dans les faits, il s’est avéré que le logiciel de gestion initialement développé par un ingénieur recruté spécifiquement à cet effet, n’était qu’imparfaitement opérationnel, sans doute aussi en raison de l’ambition même du projet. Tirant partie de notre relation ancienne avec le Laboratoire d’Informatique de l’Université de Tours, et avec l’Ecole Polytechnique de l’Université de Tours qui l’abrite, nous avons alors initié une phase de trois ans, où la réfection de cette base a constitué chaque année le sujet du projet de fin d’études de l’un des étudiants en informatique de 5ème année, qui conditionne l’obtention du titre d’ingénieur : à son tour, si ce partenariat a sans aucun doute confirmé sa pertinence pédagogique pour les étudiants ingénieurs concernés, cet objectif pédagogique même s’est révélé ne pas être véritablement compatible avec celui d’une réalisation opérationnelle pour notre laboratoire.
Cette situation a changé avec l’arrivée au sein du LLL d’un nouvel ingénieur CNRS, Yvan Stroppa, qui a repris le projet en main , et témoigné au cours de son travail d’une compréhension rare des questionnements linguistiques, et donc de leurs implications sur la structure et les fonctionnalités de la base, permettant de faire enfin progresser notre projet de façon décisive et particulièrement prometteuse. Pour résumer, les trois bases XML de ces dictionnaires, bien sûr destinées à d’autres fins que la recherche universitaire (la base du Longman est ainsi une base d’impression), ont des structures non seulement distinctes mais aussi seulement partiellement compatibles. Elles impliquent donc un travail considérable d’harmonisation, ou compatibilisation de leurs structures autour de normes que nous définissons en raison de nos objectifs, et partant de désambigüisation de leur contenu. L’étape suivante consiste d’abord en l’interfaçage des trois bases et l’élaboration des méta-données afférentes pour en construire un « inventaire » ou méta-dictionnaire unifié, puis la phase d’enrichissement, puisqu’aucun de ces trois dictionnaires ne comprend ni la morphologie (la structure interne des mots), ni la lexicologie (les relations entre les mots), et nous ambitionnons d’y adjoindre en outre un module sonore.
Comme il n’existe pas à ce jour de base de données sur la prononciation de l’anglais contemporain à la mesure de celle en cours, ce travail doit permettre de développer, tester et mettre en œuvre l’analyse du fonctionnement de la prononciation de l’anglais avec une fiabilité inégalée sur la scène scientifique internationale. On trouvera des illustrations du travail déjà accompli dans la page Corpora et la page Publications/Communications de ce site. L’interfaçage avec la base de données historique constituée à Poitiers doit permettre de vérifier et consolider cette analyse en l’articulant à la dynamique diachronique : ici encore, si cette voie a été parfois explorée, elle ne l’a jamais été avec le caractère systématique et empiriquement vérifié qui caractérise notre projet scientifique.
Nos collègues du FoRellIs de Poitiers travaillent en effet depuis plusieurs années à l’élaboration d’une base de données dictionnairiques historiques, à partir de dictionnaires de l’anglais édités depuis 1700. Depuis l’origine de notre projet nous ambitionnons de pouvoir mettre en relation ces deux bases, la nôtre et la leur, pour permettre une approche panchronique de la prononciation de l’anglais. On trouvera plus d’information à l’adresse suivante : https://forellis.labo.univ-poitiers.fr/corpus-dico-diachro/
Enfin, nous nous proposons, avec le concours de Gabriel Bergounioux, d’étendre la démarche à la prononciation du français : informations complémentaires à venir.