Parties de l'étiquette du discours et de la grammaire de la dépendance | Étiquette de point de vente

Contenu

Cibler

  • Les parties de marquage vocal et d'analyse de dépendance sont des techniques largement utilisées dans le traitement de texte.
  • Comprendre les parties des étiquettes et des grammaires vocales avec leurs cas d'utilisation respectifs dans le traitement du langage naturel.

introduction

Le traitement du langage naturel est une branche de l'apprentissage automatique qui traite de la façon dont les machines comprennent les langues humaines. Les données textuelles sont un domaine de problème largement disponible pour les tâches de PNL.

Pour travailler avec des données textuelles, il est important de transformer le texte brut d'une manière que les algorithmes d'apprentissage automatique peuvent comprendre et utiliser, c'est ce qu'on appelle le prétraitement de texte. Nous avons plusieurs techniques pour le prétraitement de texte, comme lemmatisation, lématisation, Balisage des points de vente et analyse des dépendances.

Noter: Si vous êtes plus intéressé par l'apprentissage de concepts dans un format audiovisuel, nous avons cet article complet expliqué dans la vidéo ci-dessous. Si ce n'est pas comme ça, tu peux continuer à lire.

Dans cet article, nous allons discuter des propriétés liées à la structure des données textuelles. Ici, nous parlerons des parties du discours et des grammaires de dépendances qui nous amèneront à comprendre leur fonctionnement.

Pièces d'étiquette vocale

Une partie des étiquettes de discours sont les propriétés des mots, qui définissent son contexte principal, fonctions et utilisation dans une phrase. Certaines des parties les plus couramment utilisées des balises vocales sont

capture d

Noms: Qui définit tout objet ou entité

Verbes: Qui définit une action.

Adjectifs et adverbes: Agit comme un modificateur, quantificateur ou intensificateur dans n'importe quelle phrase.

Dans une phrase, chaque mot sera associé à une partie appropriée de l'étiquette vocale. Par exemple, considérer la phrase ci-dessous

capture d

Dans cette phrase, chaque mot est associé à une partie de l'étiquette vocale qui définit ses fonctions. Ici, David a une étiquette NNP, ce qui veut dire que c'est un nom propre. En outre, a et acheté appartiennent au verbe qui indique qu'il s'agit des actions. Le magasin d'ordinateurs portables et Apple sont les noms. Nouveau est l'adjectif dont la fonction est de modifier le contexte de l'ordinateur portable.

Les étiquettes des parties du discours sont définies par la relation des mots avec les autres mots de la phrase.

Nous pouvons appliquer des modèles d'apprentissage automatique et des modèles basés sur des règles pour obtenir les étiquettes des parties vocales d'un mot. Le corpus Penn Treebank fournit les parties les plus couramment utilisées des annotations vocales. Dans lequel, un total de 48 Etiquettes PLV selon usage.

capture d

Cas d'utilisation des balises POS

Les balises de partie vocale ont un grand nombre d'applications et sont utilisées dans une variété de tâches, Quoi

  • Nettoyage de texte
  • Tâches d'ingénierie fonctionnelle
  • Désambiguïsation du sens du mot

Par exemple, considérer ces phrases

capture d

Dans les deux phrases, le livre de mots-clés est utilisé, mais dans la première phrase, est utilisé comme un verbe. Alors que dans la deuxième phrase, il est utilisé comme un nom.

Grammaire de circonscription

Parlons maintenant de grammaire.

Le premier type de grammaire est la grammaire constitutive. N'importe quel mot / groupe de mots / l'expression peut être appelée constituant. Le but de la grammaire constitutive est d'organiser n'importe quelle phrase en ses constituants en utilisant ses propriétés. Ces propriétés sont généralement déterminées par les étiquettes des parties du discours, identifier des noms ou des phrases verbales.

Par exemple, la grammaire de circonscription peut définir que toute phrase peut être organisée en trois constituants: un sujet, un contexte ou un objet. Ces composants peuvent prendre des valeurs différentes et, en conséquence, ils peuvent générer des phrases différentes.

capture d

Une autre façon de considérer la grammaire constitutive est de les définir en fonction de leurs parties du discours.. Les balises indiquent une structure grammaticale qui contient un . Cela correspond à la même phrase, Les chiens aboient dans le parc.

capture d

Grammaire des dépendances

Nous avons aussi un autre type de grammaire, c'est-à-dire, grammaire des dépendances, qui stipule que “Les mots d'une phrase dépendent des autres mots de la phrase”.

Par exemple, dans la dernière phrase, un chien qui aboie a été mentionné et le chien a été modifié en aboyant puisque le modificateur de dépendance à l'adjectif existe entre les deux.

La grammaire des dépendances organise les mots d'une phrase en fonction de leur dépendance. L'un des mots de la phrase agit comme la racine et tous les autres mots sont directement ou indirectement liés à la racine par ses dépendances. Ces dépendances représentent la relation entre les mots d'une phrase.

La grammaire des dépendances est utilisée pour comprendre la structure et les dépendances sémantiques entre les mots. Prenons un exemple.

capture d

L'arbre de dépendance pour cette phrase ressemble à ceci.

arbre-6283778

Dans cet arbre, le mot racine est “communauté”, avoir NN dans l'étiquette vocale et tous les autres mots de cet arbre sont enracinés directement ou indirectement avec une relation de dépendance en tant qu'objet direct / sujet direct, modificateurs, etc.

Ces relations définissent leurs rôles et fonctions de chaque mot dans la phrase et comment les différents mots se connectent les uns aux autres.. Ici, chaque dépendance peut être représentée comme un triplet contenant une relation, un gouverneur et un greffier. Cela signifie qu'une personne à charge est liée au gouverneur par une relation. En d'autres termes, ils sont sujet-verbe ou objet.

Comme dans le dernier exemple, DataPeaker est le sujet ou le gouverneur, la plus grande communauté de science des données est le commis ou l'objet.

capture d

Cas d'utilisation de la grammaire de dépendance

La grammaire de dépendance a plusieurs cas d'utilisation, par exemple

  • En reconnaissance de l'entité nommée
  • Système de questions-réponses
  • Dans les résolutions de co-référence, où la tâche consiste à mapper les pronoms avec les phrases nominales respectives.
  • Résumé des problèmes dans le texte.
  • Fonctions pour les problèmes de classification de texte

Remarques finales

Pour resumer, dans cet article, nous avons examiné les étiquettes pour les parties du discours et deux types de grammaire, c'est-à-dire, grammaire de circonscription et grammaire de dépendance. Nous avons également examiné certains des exemples importants et des cas d'utilisation qui en découlent.

Si vous cherchez à commencer votre parcours en science des données et que vous voulez tous les sujets sous un même toit, votre recherche s'arrête ici. Jetez un œil à l'IA et au ML BlackBelt certifiés de DataPeaker Plus Programme

Si vous avez des questions, faites le moi savoir dans la section commentaire!

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.