Análise de Sentimentos em Português
LeIA (Léxico para Inferência Adaptada) é um fork do léxico e ferramenta para análise de sentimentos VADER (Valence Aware Dictionary and sEntiment Reasoner) adaptado para textos em português, com suporte para emojis e foco na análise de sentimentos de textos expressos em mídias sociais - mas funcional para textos de outros domínios.
Modo de uso
A biblioteca preserva a API do VADER, e o texto de entrada não precisa ser pré-processado:
from LeIA import SentimentIntensityAnalyzer
s = SentimentIntensityAnalyzer()
# Análise de texto simples
s.polarity_scores('Eu estou feliz')
#{'neg': 0.0, 'neu': 0.328, 'pos': 0.672, 'compound': 0.6249}
# Análise de texto com emoji :)
s.polarity_scores('Eu estou feliz :)')
#{'neg': 0.0, 'neu': 0.22, 'pos': 0.78, 'compound': 0.7964}
# Análise de texto com negação
s.polarity_scores('Eu não estou feliz')
#{'neg': 0.265, 'neu': 0.241, 'pos': 0.494, 'compound': 0.4404}
A saída da análise de sentimentos é um dicionário com os seguintes campos:
pos
: porcentagem positiva do textoneg
: porcentagem negativa do textoneu
: porcentagem neutra do textocompound
: valor de sentimento geral normalizado, variando de -1 (extremamente negativo) a +1 (extremamente positivo)
O valor compound
pode ser utilizado para descrever o sentimento predominante no texto, por meio dos limites de valores:
- Sentimento positivo:
compound >= 0.05
- Sentimento negativo:
compound <= -0.05
- Sentimento neutro:
(compound > -0.05) and (compound < 0.05)