TextInsight
TextInsight es una biblioteca Python para análisis de texto que combina análisis de sentimientos, generación de temas y corrección de texto utilizando modelos NLP de última generación.
Características
- Análisis de Sentimientos: Analiza emociones en textos usando modelos BERT multilingües
- Generación de Temas: Extrae y categoriza temas principales usando GPT-3.5
- Corrección de Texto: Corrección inteligente con niveles personalizables de sensibilidad
Instalación
pip install textinsight
Inicio Rápido
from textinsight import TextInsight
insight = TextInsight(api_key="tu-openai-api-key")
insight = TextInsight(api_key_file=".env")
textos = [
"Este producto es excelente!",
"El servicio necesita mejorar"
]
resultados = insight.analizar(textos, {
'sentimientos': True,
'temas': True,
'correccion': True
})
Opciones de Configuración
Configuración de API Key
Puedes proporcionar la API key de OpenAI de tres formas:
insight = TextInsight(api_key="sk-...")
insight = TextInsight(api_key_file="ruta/al/.env")
export OPENAI_API_KEY="sk-..."
Opciones de Análisis
opciones = {
'sentimientos': True,
'temas': True,
'correccion': True,
'num_temas': 3,
'sensibilidad': "Moderado",
'contexto': {
'proyecto_nombre': "Nombre del Proyecto",
'proyecto_descripcion': "Descripción del Proyecto",
'palabras_clave': ["palabras", "clave"],
'notas_adicionales': "Notas adicionales"
}
}
Resultados de Análisis
Análisis de Sentimientos
resultado = insight.analizar(textos, {'sentimientos': True})
sentimientos = resultado['sentimientos']
print(sentimientos.dataframe)
print(sentimientos.metricas)
Generación de Temas
resultado = insight.analizar(textos, {
'temas': True,
'num_temas': 3
})
temas = resultado['temas']
print(temas.dataframe)
print(temas.temas_frecuencia)
Corrección de Texto
resultado = insight.analizar(textos, {
'correccion': True,
'sensibilidad': 'Moderado'
})
correcciones = resultado['correccion']
print(correcciones.dataframe)
print(correcciones.metricas)
Niveles de Sensibilidad de Corrección
- Ninguna: Sin correcciones
- Leve: Solo errores ortográficos evidentes
- Moderado: Ortografía, gramática y puntuación estándar
- Exhaustivo: Corrección integral incluyendo mejoras de estilo
Requisitos
- Python ≥ 3.8
- Dependencias:
- pandas ≥ 1.3.0
- transformers ≥ 4.0.0
- python-dotenv ≥ 0.19.0
- openai = 0.28
- python-Levenshtein ≥ 0.12.0
Licencia
Este proyecto es de uso exclusivo interno para Ipsos. Todos los derechos reservados.
© 2024 Ipsos. Este software y su documentación son confidenciales y propietarios.
Está estrictamente prohibida su distribución, modificación o uso no autorizado fuera de Ipsos.