Inteligência Artificial: O que é Processamento de Linguagem Natural (PLN)?

Provavelmente ao se tratar de Inteligência Artificial, você já ouviu falar de Machine Learning e Deep Learning. Outra das tecnologias indispensáveis para IA é o Processamento de Linguagem Natural (PLN).

Alfabeto com letras de madeira
Post-it pendurado em um varal com a palavra Chatbot
Os chatbots são um dos exemplos mais famosos quando falamos de Processamento de Linguagem Natural (PLN).

Os 7 níveis de processamento

  • Fonologia: estuda o sistema sonoro da língua, e como se comportam esses sons nas pronúncias;
  • Morfologia: trata de um modo geral a classificação, estrutura e a formação das palavras através de elementos morfológicos, ou seja, fragmentos que contém significado e compõem um todo, os morfemas;
  • Léxico: interpreta o significado das palavras;
  • Sintático: é a parte em que estudamos as regras que regem a construção das frases nas línguas naturais: a disposição das palavras na frase e das frases num discurso, e suas infinitas combinações possíveis para transmitir uma ideia;
  • Semântico: possibilita a interpretação das sentenças e dos enunciados, ou seja, dá significado a uma frase, enquanto o discurso faz uma análise do significado do texto;
  • Discurso: toda situação que envolve a comunicação dentro de um determinado contexto;
  • Pragmático: estuda essencialmente o objetivo da comunicação, algo que não está descrito nas palavras de maneira explícita.

Tipos de abordagem

  • Simbólica;
  • Estatística;
  • Conexionista;
  • Híbrida.

Técnicas de PLN

Análise Sintática

  • A tokenização, que consiste em dividir um texto em partes menores, chamadas tokens (que podem ser frases ou palavras) para tornar o texto mais fácil de manusear;
  • A marcação de parte da fala (marcação PoS), que marca os tokens como verbo, advérbio, adjetivo, substantivo, etc. Isso ajuda a inferir o significado de uma palavra (por exemplo, a palavra “livro” significa coisas diferentes se usada como verbo ou substantivo);
  • A lematização, por sua vez, consiste em reduzir as palavras flexionadas à sua forma básica para torná-las mais fáceis de analisar;
  • A remoção de palavras remove palavras de ocorrência frequente que não adicionam nenhum valor semântico, como eu, eles, tenho, gosto, seu, etc.

Análise Semântica

  • A desambiguação do sentido da palavra tenta identificar em que sentido uma palavra está sendo usada em um determinado contexto;
  • A extração de relacionamento tenta entender como as entidades (lugares, pessoas, organizações, etc.) se relacionam umas com as outras em um texto.

--

--

CEO & Fundador da PMG Academy | MBA-FGV | Pós-Graduado Neurociência Educacional | Consultor de TI | Design Instrucional na https://adrianomartinsantonio.com.br

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
Adriano Martins Antonio

CEO & Fundador da PMG Academy | MBA-FGV | Pós-Graduado Neurociência Educacional | Consultor de TI | Design Instrucional na https://adrianomartinsantonio.com.br