En la era del comercio electrónico, que bajo las circunstancias actuales continúa siendo el vector de mayor crecimiento, las opiniones de otros se han vuelto una de las características principales a la hora de adquirir algún bien. Y es que, ¿Quién no se ha encontrado en la disyuntiva de escoger 1 producto entre 3 aparentemente iguales? “Mejor reviso los comentarios”… Lo cierto es que podemos finalizar o no una transacción, basado en la interpretación que le demos a un comentario, en el promedio de valoración que tenga y, si este no ha sido recomendado por un conocido fiable, indagaremos por los comentarios de otros usuarios buscando un texto que nos enganche o nos aleje.
En el libro “The Power of Bad: How the Negativity Effect Rules Us and How We Can Rule It”, los autores mencionan que una impresión negativa supera a una positiva, una pérdida financiera es más dolorosa que una ganancia equivalente y que, las numerosas críticas de cinco estrellas de un hotel en TripAdvisor, no tienen influencia suficiente un cliente que ha leído la única crítica de una sola estrella. No cabe duda que los consumidores ven en las redes sociales un medio para poder expresar sus opiniones acerca de una marca, producto o servicio y que las empresas deben imperativamente considerar estas opiniones y enfocar sus estrategias en función a ellas.
Estamos tan acostumbrados a analizar datos numéricos que solemos dejar a un lado los datos cualitativos, que ahora son el oro de los negocios; esto se ha convertido fácilmente en uno de los temas de mayor tendencia en el campo del marketing y comercio debido a su relevancia y la cantidad de problemas que está resolviendo. Dicho esto, para analizar las opiniones de los usuarios surge un KPI cualitativo llamado “Análisis de sentimientos” el cual (por supuesto) ha encontrado un gran aliado en el Big Data y ML.
El análisis de sentimientos, en esencia, es el proceso de determinar el tono emocional que hay detrás de una serie de palabras, se sirve del procesamiento del lenguaje natural y se utiliza para intentar entender las actitudes, opiniones y emociones expresadas en un texto. En nuestro día a día, implementamos el análisis de sentimientos cuando buscamos en comentarios de otros, responder interrogativas propias al momento de tomar alguna decisión. Por ejemplo:
- ¿Valdrá la pena ver esa película?
- ¿Qué piensa la gente sobre el último iPhone?
- ¿Qué tan bueno será este hotel?
- ¿Qué piensa la gente acerca de las elecciones, candidatos particulares o temas?
Las empresas, organizaciones y gobiernos son los más interesados en avanzar en esta área puesto que, poder saber lo que la gente piensa sobre sus productos, medidas y políticas es la herramienta más valiosa para obtener ventajas competitivas.
Entre sus ventajas, resalto las siguientes:
- Ayudar a predecir el comportamiento del cliente para un producto en particular.
- Ayudar a las empresas a mejorar sus capacidades de creación de valor.
- Extraer conclusiones y tomar decisiones concretas basadas en información.
- Restaurar la funcionalidad y efectividad de servicios fallidos.
- Automatizar procesos para determinar qué tan bien funcionó un producto posterior a su lanzamiento.
- Ayudar a modificar la oferta y re-orientar estrategias con acciones correctivas.
- Determinar si los influencers son adecuados para alguna marca.
- Comprender la mente del consumidor.
Ahora bien, para que esto ocurra, las máquinas deben estudiar toda la cantidad información posible de nuestro lenguaje para aprender a entendernos y uno de los retos inherentes al NLP es la complejidad del lenguaje humano. Imaginen cuanta información se debe procesar para enseñar a una máquina a analizar los diferentes matices gramaticales, sarcasmos, como usamos los emoticones, las distintas variaciones culturales, nuestras jergas y fallas de ortografía; imaginen enseñar a una máquina a entender como el contexto puede afectar la interpretación del sentimiento de un mensaje. Solo por citar un par de ejemplos de la complejidad de la lengua castellana:
1. Un símbolo puede cambiarlo todo:
Vamos a comer niños / Vamos a comer, niños.
2. Dos símbolos pueden cambiar el mensaje rotundamente:
3. Contextualizar frases:
“Ha llegado el verano y se dañó mi ventilador. ¡Genial!”.
En este último ejemplo, la mayoría de los humanos podrían interpretar que es un sarcasmo, sabemos que no es grato atravesar el verano sin un ventilador. Al aplicar este entendimiento contextual a la frase, podemos identificarla fácilmente como negativa, pero sin este entendimiento, una máquina que procesa la frase podría evaluar la palabra “genial” y categorizarla como positiva.
APLICACIONES:
De manera general, podemos dividir los problemas en el análisis de sentimientos en 3 categorías:
- Polaridad del texto: se refiere a identificar correctamente la orientación del texto. Esto puede ser: negativo, positivo o neutro.
- Calificación de sentimiento dentro de un ranking: Asigna un rango numérico al sentimiento de algún texto dando mayor granularidad que el punto anterior. Por ejemplo, podemos generar un modelo que asigne una calificación a las reseñas de IMDB, de 1 a 5, siendo 1 negativo y 5 muy positivo.
- Análisis de sentimientos basados en aspectos: Determina el sentimiento hacia aspectos específicos en el texto. Algunas veces querremos saber cuales son los comentarios asociados a las polaridades de un texto, aspectos o características en particular de las que las personas hablan.
En un futuro próximo, para capturar y entender el amplio rango de emociones que los humanos expresamos por escrito, necesitaremos una escala multidimensional más sofisticada. ¿Serán las máquinas capaces de medir el escepticismo, la decepción, la esperanza, la ansiedad, la emoción o la falta de ella?
A medida que la comunicación basada en texto, como las redes sociales y los chats en vivo, se vuelvan más populares en el servicio al cliente, las empresas necesitarán una forma de filtrar de manera más precisa y eficiente los comentarios de sus clientes.
MACHINE LEARNING & ANÁLISIS DE SENTIMIENTOS.
En español tratamos el termino “Machine Learning” como “Aprendizaje Automático” y cuando nos referimos a un modelo, hacemos referencia al resultado de este aprendizaje automático para responder alguna tarea dada, siendo esto una representación matemática. Recordemos que existen dos áreas de estudio en el aprendizaje automático: supervisado y no supervisado y dentro de estas dos grandes áreas, existen diversas técnicas utilizadas en el análisis de sentimientos.
Las técnicas se pueden expresar como un modelo y si luego se aplican a otro texto, pertenecerían al aprendizaje automático supervisado; en este tipo de aprendizaje, se hacen predicciones empleando un conjunto de textos de entrenamiento, creados y clasificados previamente de forma semiautomática. Basándose en estos conjuntos de textos el algoritmo de aprendizaje supervisado desarrolla un clasificador capaz de realizar predicciones acerca del tipo de sentimiento u opinión expresado en los nuevos textos que se desean clasificar.
También podríamos hablar de un conjunto de algoritmos que funcionan en grandes conjuntos de datos para extraer significado, lo que se conoce como aprendizaje automático no supervisado. En este caso, no se utilizan textos de entrenamiento previamente clasificados, sino que se agrupan los textos por su similitud en clases que no están predefinidas. La creación de estos “clústers” tienen como objetivo intentar encontrar patrones de similitud en los textos y agruparlos por sus características comunes.
Ambas técnicas tienen ventajas sobre la otra. Por ejemplo, los modelos de aprendizaje automático son excelentes para reconocer entidades y sentimientos generales para un documento, pero luchan por extraer temas, tópicos y referir el sentimiento a entidades o temas individuales. Alternativamente, podemos enseñarle a nuestro sistema a identificar las reglas y patrones básicos del lenguaje mediante aprendizaje no supervisado.
Por ejemplo, en nuestro idioma un nombre propio (Jorge Juan) precedido por la palabra “calle” probablemente denota un nombre de calle. Del mismo modo, la palabra “calle”, seguida por un nombre propio, seguido por un número, es probablemente una dirección. Para responder a estos casos, donde se necesitan distintas funcionalidades para llegar a un fin, surge un término general llamado “aprendizaje híbrido” que combina ambas técnicas para resolver problemas complejos.
Digo todo esto para darnos una breve idea de la lógica de la cual se sirven estos analizadores al momento de programarles. Les invito a probar diversos analizadores de sentimientos disponibles en la web que pueden aclarar lo expuesto:
Nuestro lenguaje es desordenado y complejo, el significado varía de un hablante a otro y de un oyente a otro. El aprendizaje automático puede ser una buena solución para analizar datos de texto, pero continúa y continuará en desarrollo por la complejidad inherente a estos factores.
EJEMPLOS NOVEDOSOS:
Me gustaría mencionar el proyecto “emojization”, el cual se sirve de un modelo entrenado con más de 1.2 billones de tweets en inglés y pretende entender el uso de emoticones en nuestras frases para luego interpretar los tonos emocionales de cualquier texto, etiquetándolos con los emojis correspondientes.
“Las nubes de emojis a continuación muestran los emojis que mejor describen los tweets de tres líderes. Tenga en cuenta que los emojis no se extraen de los tweets; de hecho, muy pocos de ellos contienen emojis, pero presentan una interpretación de ellos.”
Lo cierto es que los consumidores de hoy día valoramos enormemente lo que los demás dicen sobre las empresas. Sectores donde la experiencia del cliente es un factor de supervivencia, necesitan la ayuda de la inteligencia artificial para resolver problemas de análisis de texto donde el volumen de datos es simplemente insostenible para procesar por un humano.
Me despido con un video un poco más técnico pero muy entretenido, para profundizar el tema:
Y algunas herramientas disponibles en el mercado actual para analizar sentimientos.
Este artículo no iba a salir, pero salió!!! (inserte sentimiento neutral)
Espero sus comentarios y sugerencias con mi post, gracias siempre por leerme.