Inteligência Artificial: O que é Processamento de Linguagem Natural (PLN)?

Provavelmente ao se tratar de Inteligência Artificial, você já ouviu falar de Machine Learning e Deep Learning. Outra das tecnologias indispensáveis para IA é o Processamento de Linguagem Natural (PLN).

Alfabeto com letras de madeira
Post-it pendurado em um varal com a palavra Chatbot
Os chatbots são um dos exemplos mais famosos quando falamos de Processamento de Linguagem Natural (PLN).

Os 7 níveis de processamento

Algumas palavras e estruturas são ambíguas, como por exemplo, a própria palavra “língua”, que pode se referir a um idioma ou ao órgão muscular do sistema digestivo. Quando ela aparece inserida em um enunciado, a compreensão pode ser alcançada pela máquina por meio de uma análise de texto ou através de uma série de perguntas feitas ao usuário.

  • Morfologia: trata de um modo geral a classificação, estrutura e a formação das palavras através de elementos morfológicos, ou seja, fragmentos que contém significado e compõem um todo, os morfemas;
  • Léxico: interpreta o significado das palavras;
  • Sintático: é a parte em que estudamos as regras que regem a construção das frases nas línguas naturais: a disposição das palavras na frase e das frases num discurso, e suas infinitas combinações possíveis para transmitir uma ideia;
  • Semântico: possibilita a interpretação das sentenças e dos enunciados, ou seja, dá significado a uma frase, enquanto o discurso faz uma análise do significado do texto;
  • Discurso: toda situação que envolve a comunicação dentro de um determinado contexto;
  • Pragmático: estuda essencialmente o objetivo da comunicação, algo que não está descrito nas palavras de maneira explícita.

Tipos de abordagem

Para todos esses níveis de processamento, temos os tipos de abordagem, que é como esses dados serão tratados pelos softwares. Eles são divididos em quatro tipos:

  • Estatística;
  • Conexionista;
  • Híbrida.

Técnicas de PLN

O Processamento de Linguagem Natural (PLN) aplica duas técnicas para ajudar os computadores a entender o texto: análise sintática e análise semântica.

Análise Sintática

A análise sintática trata o texto usando regras gramaticais básicas para identificar a estrutura da frase, como as palavras são organizadas e como as palavras se relacionam entre si.

  • A marcação de parte da fala (marcação PoS), que marca os tokens como verbo, advérbio, adjetivo, substantivo, etc. Isso ajuda a inferir o significado de uma palavra (por exemplo, a palavra “livro” significa coisas diferentes se usada como verbo ou substantivo);
  • A lematização, por sua vez, consiste em reduzir as palavras flexionadas à sua forma básica para torná-las mais fáceis de analisar;
  • A remoção de palavras remove palavras de ocorrência frequente que não adicionam nenhum valor semântico, como eu, eles, tenho, gosto, seu, etc.

Análise Semântica

A análise semântica se concentra em capturar o significado do texto. Primeiro, ele estuda o significado de cada palavra individual (semântica lexical). Em seguida, analisa a combinação de palavras e o que significam no contexto. As principais subtarefas da análise semântica são:

  • A extração de relacionamento tenta entender como as entidades (lugares, pessoas, organizações, etc.) se relacionam umas com as outras em um texto.

--

--

CEO & Fundador da PMG Academy | MBA-FGV | Pós-Graduado Neurociência Educacional | Consultor de TI | Design Instrucional na https://adrianomartinsantonio.com.br

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
Adriano Martins Antonio

CEO & Fundador da PMG Academy | MBA-FGV | Pós-Graduado Neurociência Educacional | Consultor de TI | Design Instrucional na https://adrianomartinsantonio.com.br