Partes da etiqueta da fala e gramática de dependência | Tag PoS

Conteúdo

objetivo

  • A marcação de classes gramaticais e a análise de dependência são técnicas amplamente utilizadas no processamento de texto..
  • Compreender os rótulos de classes gramaticais e gramáticas com seus respectivos casos de uso no processamento de linguagem natural.

Introdução

O processamento de linguagem natural é um ramo do aprendizado de máquina que trata de como as máquinas entendem as linguagens humanas. Dados de texto são um domínio de problema amplamente disponível para tarefas de PNL.

Para trabalhar com dados de texto, é importante transformar o texto bruto de uma forma que os algoritmos de aprendizado de máquina possam entender e usar, isso é chamado de pré-processamento de texto. Temos várias técnicas de pré-processamento de texto, como lematização, lematización, Marcação de PDV e análise de dependência.

Observação: Se você está mais interessado em aprender conceitos em formato audiovisual, temos esse artigo completo explicado no vídeo abaixo. Sim, não é assim, você pode continuar lendo.

Neste artigo, vamos discutir as propriedades relacionadas à estrutura dos dados do texto. Aqui, vamos falar sobre as classes gramaticais e gramáticas de dependência que nos levarão a entender como funcionam.

Partes de marca vocal

Rótulos de parte da fala são as propriedades das palavras, que definem seu contexto principal, funções e uso em uma frase. Algumas das marcas de classe gramatical mais comumente usadas são

screenshot-from-2021-03-24-16-36-57-4225937

Substantivos: Que define qualquer objeto ou entidade

Verbos: Isso define alguma ação.

Adjetivos e advérbios: Atua como um modificador, quantificador ou intensificador em qualquer frase.

Em uma frase, cada palavra será associada a uma parte apropriada da marca vocal. Por exemplo, considere a frase abaixo

screenshot-from-2021-03-24-16-31-32-5047547

Nesta frase, cada palavra é associada a uma parte da marca vocal que define suas funções. Aqui, David tem uma tag NNP, o que significa que é um nome próprio. O que mais, tem e comprou pertencem ao verbo que indica que são as ações. O laptop e a Apple Store são os substantivos. Novo é o adjetivo cuja função é modificar o contexto do laptop.

Os rótulos das partes do discurso são definidos pela relação das palavras com as outras palavras da frase.

Podemos aplicar modelos de aprendizado de máquina e modelos baseados em regras para obter os rótulos das partes da fala de uma palavra. O corpus Penn Treebank fornece as partes mais comumente usadas de anotações de marca vocal. No qual, um total de 48 Etiquetas POS de acordo com o uso.

screenshot-from-2021-03-24-15-17-13-5149298

Casos de uso de tag de PDV

As etiquetas da parte de voz têm um grande número de aplicativos e são usadas em uma variedade de tarefas, O que

  • Limpeza de texto
  • Tarefas de engenharia de funções
  • Desambiguação do significado da palavra

Por exemplo, considere essas sentenças

screenshot-from-2021-03-24-16-38-43-6202494

Em ambas as frases, o livro de palavras-chave é usado, mas na primeira frase, é usado como um verbo. Enquanto na frase dois é usado como substantivo.

Gramática do grupo constituinte

Agora vamos falar sobre gramática.

O primeiro tipo de gramática é a gramática constitutiva. Qualquer palavra / grupo de palavras / frase pode ser chamada de constituinte. O objetivo da gramática constitutiva é organizar qualquer frase em seus constituintes usando suas propriedades. Essas propriedades geralmente são orientadas pelos rótulos das classes gramaticais, a identificação de substantivos ou frases verbais.

Por exemplo, A gramática da circunscrição pode definir que qualquer frase pode ser organizada em três constituintes: um assunto, um contexto ou um objeto. Esses componentes podem assumir diferentes valores e, em consequência, eles podem gerar frases diferentes.

screenshot-from-2021-03-24-16-41-40-9150213

Outra maneira de ver a gramática constitutiva é defini-la em termos de suas classes gramaticais.. As tags indicam uma estrutura gramatical que contém um . Isso corresponde à mesma frase, Cachorros latem no parque.

screenshot-from-2021-03-24-16-43-33-6264710

Gramática de dependência

Também temos um tipo diferente de gramática, quer dizer, gramática de dependência, Que afirma que “As palavras de uma frase dependem das outras palavras da frase”.

Por exemplo, na última frase, um cachorro latindo foi mencionado e o cachorro foi modificado por latir, pois o modificador de dependência de adjetivo existe entre os dois.

A gramática de dependência organiza as palavras em uma frase de acordo com sua dependência. Uma das palavras da frase atua como raiz e todas as outras palavras estão direta ou indiretamente vinculadas à raiz por meio de suas dependências. Essas dependências representam a relação entre as palavras em uma frase.

A gramática de dependência é usada para entender a estrutura e as dependências semânticas entre as palavras. Vamos considerar um exemplo.

screenshot-from-2021-03-24-16-46-12-5916287

A árvore de dependência para esta frase se parece com isto.

árvore-6283778

Nesta árvore, a palavra raiz é “comunidade”, tendo NN como parte da marca vocal e todas as outras palavras nesta árvore são enraizadas direta ou indiretamente com uma relação de dependência como um objeto direto / sujeito direto, modificadores, etc.

Essas relações definem seus papéis e funções de cada palavra na frase e como várias palavras se conectam entre si.. Aqui, cada dependência pode ser representada como um trio contendo uma relação, um governador e um escrivão. Isso significa que um dependente está conectado ao governador por um relacionamento. Em outras palavras, eles são sujeito-verbo ou objeto.

Como no último exemplo, DataPeaker é o sujeito ou governador, a maior comunidade de ciência de dados é o funcionário ou objeto.

screenshot-from-2021-03-24-16-48-32-3397635

Casos de uso de gramática de dependência

A gramática de dependência tem vários casos de uso, por exemplo

  • Em reconhecimento da entidade nomeada
  • Sistema de perguntas e respostas
  • Em resoluções de co-referência, onde a tarefa é mapear os pronomes com as respectivas frases nominais.
  • Problemas de resumo no texto.
  • Funções para problemas de classificação de texto

Notas finais

Para resumir, neste artigo, vimos rótulos para classes gramaticais e dois tipos de gramática, quer dizer, gramática de circunscrição e gramática de dependência. Também vimos alguns dos exemplos importantes e casos de uso deles.

Se você está procurando iniciar sua jornada de ciência de dados e deseja todos os tópicos sob o mesmo teto, sua busca para aqui. Dê uma olhada no AI e ML BlackBelt certificados da DataPeaker Mais Programa

Se você tiver alguma dúvida, deixe-me saber na seção de comentários!

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.