Contribution méthodologique à la constitution d'un dictionnaire informatique des verbes

Analyse sémantico-cognitive des verbes de mouvement et d'activité

Résumé de la thèse
in English
Nous proposons une contribution méthodologique à la construction d'un dictionnaire sémantique des verbes du français en vue de traitements informatiques de la langue, en explorant l'hypothèse de l'unité verbale:

où se situe-t-elle, comment la décrire, et une signification lexicale intrinsèque du verbe a-t-elle un sens?

Nous cherchons à poser les ingrédients théoriques nécessaires à la constitution d'une telle unité, puis, munis de ces outils formels, nous explorons le lexique , en observant son comportement dans la langue, afin de voir ce que le formalisme met en évidence, et si les résultats qu'il produit peuvent faire avancer notre connaissance des processus langagiers.
Notre thèse s'inscrit dans le programme de la Grammaire Applicative et Cognitive (GAC), qui vise à mettre en place un système métalinguistique général, cohérent et conduisant à de véritables calculs formels, éventuellement automatisables. Pour cela, la GAC développe une théorie des invariants langagiers, constitués d'opérateurs et d'opérations élémentaires. Les Schèmes Sémantico-Cognitifs (SSC) constituent une structure de représentation formelle de la signification du verbe.
Nous explorons les possibilités de ce formalisme pour représenter la sémantique lexicale d'un corpus de verbes de mouvement et d'action du français, dans le but:

La première partie pose (ch.1) le cadre formel, et situe les connaissances lexicalisées par rapport aux connaissances grammaticalisées et à celles, plus générales, du contexte, qui reste le plus souvent tacite. Verbaliser le mouvement revient à représenter dans la langue l'évolution spatio-temporelle d'entités. La physique, dans la mécanique classique, a formalisé le mouvement, mais au prix d'efforts savants qui ne prennent pas en compte la langue. Nous avons choisi une représentation formelle, issue des observables de la langue, explicitée au ch. 2. Nous représentons les domaines lexicalisés du stable, du mouvement, et des effecteurs du mouvement, par des combinaisons de relations entre des entités typées, constituant des structures, les schèmes sémantico-cognitifs (SSC). Les primitives utilisées pour décrire la signification des verbes sont justifiée par une théorie localiste cognitive, développée au ch.3. Cerner la part de la sémantique lexicale dans la signification d'un verbe nécessite, outre le choix des primitives et des opéra teurs, un typage sémantique dont nous décrivons le principe (ch.4). Un type sémantique premier est interprétable dans un contexte percepto-culturel. Des catégorisateurs, explicites ou non, peuvent opérer des changements de type. Nous discutons en fin de cette partie (ch.5) des critères utilisables pour une classification des verbes de mouvement et d'action.

Dans la deuxième partie, après avoir décrit quelques dictionnaires sémantiques compatibles avec une utilisation informatique, nous exposons la méthode choisie pour caractériser la polysémie verbale et pour trouver, non pas dans la langue mais au niveau cognitif, un invariant de sens générateur de cette polysémie. La méthode est appliquée à la description d'une cinquantaine d'item verbaux du lexique français, rangés par ordre lexicographique, base de ce travail.

La troisième partie montre quelques applications opératoires possibles: Les schèmes sémantico-cognitifs, les procédures d'intégration et les espaces référentiels où s'inscrivent les scènes mentales doivent être coulés dans des formes et des écritures implémentables sur des machines concrètes. Chacune des significations d'un lexème verbal est alors une sorte de nom de SSC" qui, lorsqu'il est évoqué au cours d'un discours, renvoie à une scène dont les places vides se remplissent progressivement par les objets présentés dans le discours, semblables aux appels de procédure de certains langages de programmation. Il est tentant de faire apparaitre sur un écran ces scènes dont la langue spécifie l'animation. Réalisées pour quelques verbes, ces applications constituent une première implémentation de notre projet cognitif, qui est de relier la langue à l'image, non pas directement, mais en compilant successivement des niveaux de représentations, simulant un processus de compréhension de la langue.

Nous concluons par un bilan de l'avancée de nos recherches, et de leur intérêt du point de vue: de leur application informatique, de la linguistique de la sémantique du lexique verbal, et d'une avancée en faveur de la théorie localiste, reformulée à un niveau cognitif. 
Nous tentons donc d'organiser de manière opératoire la catégorie sémantique du mouvement verbalisé, en tenant compte du travail des linguistes, psychologues, anthropologues et philosophes, tout en restant ingénieur et informaticien, c'est-à dire qu'il nous faut déterminer la portée de la validité de cette organi sation.

En annexe, nous rappelons le problème du traitement informatique de la langue naturelle et la théorie de la grammaire applicative et cognitive (annexe A), qui constitue le cadre formel de la description des SSC. Nous indiquons également (annexe B) le formalisme mathématique permettant l'intégration d'un SSC en un prédicat du 1er ordre, et (annexe C) les notations utilisés; en annexe D, nous donnons les textes à l'origine du corpus.