Parsing

The content on this page was translated automatically.

Parsing

L'analyse syntaxique est un processus consistant à "utiliser une grammaire pour attribuer une analyse syntaxique à une chaîne de mots, une lattice d'hypothèses de mots émises par un locuteur" (Carroll, 2003, p. 233). Dans MTK, nous utilisons deux types de grammaire : constituency et  dependency.

Grammaire de constitution

L'idée fondamentale de la constituance est que des groupes de mots forment une seule unité ou phrase, appelée constituant (Jurafsky & Martin, 2000).

La grammaire de constitution décrit la structure syntaxique des phrases en termes de hiérarchies phraséologiques.

 

Grammaire de dépendance

 

Les grammaires de dépendance se concentrent sur les relations directes entre les mots dans une phrase particulière.

 

 

Parsing et langages formels

L'approche basée sur les phrases identifie les phrases et les catégories structurelles dans une phrase donnée. En analysant la structure de la phrase à travers le prisme d'une grammaire de constituants, nous pourrions être en mesure d'extraire l'information pertinente des bouquets de phrases aidant à l'identification des concepts.

La grammaire de dépendance, d'autre part, semble être importante pour identifier les relationsParsing entre les concepts et les attributs d'un concept particulier. La raison en est sa capacité à découvrir des relations de tête (par ex. le verbe comme tête), des catégories fonctionnelles (par ex. sujet, objet direct, complément d'une préposition, et d'autres).

SBVR

Dans le contexte de la langue naturelle, les éléments clés importants pour le SBVR sont le verbe et sa relation avec le sujet/acteur et l'objet. Identifier le verbe à l'aide d'une approche par constituants est possible. Cependant, certains cas, comme les constructions passives, peuvent poser problème. De plus, l'identification du sujet et de l'objet corrects échoue souvent avec la grammaire de constituants, lorsque les phrases sont plus longues ou que le sujet apparaît après le verbe. La grammaire de dépendance se concentre sur l'identification du verbe et les dépendances entre les différentes parties de la phrase. Dans le MTK, nous avons construit une interface qui utilise les résultats produits par la Dependency Grammar (Stanford Parser) et extrait les verbes, les sujets et les objets qui sont dans une certaine relation  avec ce verbe (= mot de tête). Les premiers tests ont montré que même les constructions passives telles que
comme "Les produits ont été achetés par l'entreprise" ont été traitées correctement.