Reconocimiento de la polaridad semántica

 

1.  Estado de la cuestión

1.1 Análisis sentimental

Dentro del campo de investigación de la minería de datos, haciendo uso de la lingüística computacional, el procesamiento del lenguaje natural (PLN) y el análisis de textos, se halla una disciplina llamada análisis sentimental (sentiment analysis), también citada en la bibliografía como minería de sentimientos (opinion mining) o análisis de subjetividad (subjetiviy analysis).

El análisis sentimental, según Jorge Carillo de Albornoz (2011), “hace referencia a la tarea de análisis, identificación y clasificación de todo tipo de contenido emocional, subjetivo u opinado”.

En términos generales, el análisis sentimental tiene como objetivo determinar la actitud de un orador o un escritor con respecto a algún tema, o la polaridad global contextual de un documento.

Un posible desglose de las tareas abarcadas por esta disciplina sería la siguiente realizada por el ya mencionado autor, Jorge Carrillo de Albornoz (2011):

–        Clasificación de la subjetividad: tarea cuyo objetivo es la identificación de fragmentos de texto que poseen una carga subjetiva, expresada por parte de la persona que ha escrito el texto, ya sea una opinión, la expresión de un sentimiento, etc.

–        Clasificación de la polaridad: tarea que pretende clasificar fragmentos de texto, en positivo o negativo dependiendo de su significado emocional.

–        Clasificación de la intensidad: esta tarea pretende clasificar los textos de entrada de acuerdo a la intensidad emocional expresada, según tres clases de intensidad: positivo, neutro y negativo; o recientemente, se está clasificando también en cinco clases de intensidad: fuertemente positivo, positivo, neutral, negativo, fuertemente negativo.

–        Análisis sentimental basado en tópicos/características: en este caso la detección y el análisis emotivo del texto está basado en ciertas características del propio texto, ponderando el análisis global. Este tipo de sistemas suelen evaluar documentos que recogen opiniones sobre productos o servicios donde ciertos aspectos condicionan más que otros la carga afectiva global de la opinión.

–        Minería de opiniones: tarea más especializada en recuperación de información, en la que, dada una consulta, los sistemas deben ser capaces de determinar los documentos relevantes de dicha consulta acerca de un tema en concreto, así como clasificarlos dentro de ciertas categorías.

Ha de señalarse, sin embargo, que a pesar de la clasificación de las tareas realizada, es común hallar estudios donde no se centren en una única tarea, sino que con frecuencia aparecen combinadas.

De estas tareas, las de mayor relevancia, podría decirse que son la clasificación de la subjetividad, la clasificación de la polaridad y la clasificación de la intensidad.

De aquí en adelante, una vez analizado el marco global en el que se sitúa el análisis de sentimiento y sus correspondientes tareas, el trabajo se centrará en la clasificación de la polaridad, por ser éste el objeto de estudio del trabajo.

1.2 Clasificación de la polaridad

La clasificación de la polaridad tiene como objetivo obtener una puntuación que indique si el texto expresa una opinión positiva o negativa, dentro de un rango donde 0 indicaría una carga subjetiva neutra, 1 una carga subjetiva positiva y -1 una carga subjetiva negativa.

Para la resolución de un problema de clasificación de la polaridad se pueden seguir dos estrategias: la supervisada y la no supervisada. El trabajo que se toma como referencia para los métodos supervisados es Pang, Lee y Vaithyanathan, 2002, que utiliza como característica la presencia o no de los términos para el cálculo de la polaridad. En la estrategia supervisada, además de la utilización de características léxicas, también se ha intentado explotar la información sintáctica. Un ejemplo de ello son los trabajos según Mullen y Collier, 2004 y Whitelaw, Garg y Argamon, 2005, en los que se utilizan los adjetivos para la clasificación de la polaridad.

Por otro lado, los métodos no supervisados se fundamentan en la detección de identificadores de subjetividad u opinión en los textos, para después calcular la polaridad empleando alguna función basada en los indicadores encontrados. Para la identificación se utilizan conjuntos de vocablos etiquetados por su polaridad. Es por ello que existen tres estrategias para la elaboración de estos lexicones:

–           El enfoque manual, que se suele aplicar como último paso a modo de revisión.

–           El método basado en diccionario, que se encarga de construir un lexicón etiquetado por medio de la combinación de un conjunto de palabras y el uso de recursos léxicos como WordNet (Kim y Hovy, 2004), (Hu y Liu, 2004).

–           Los métodos basados en corpus se basan en las características propias del corpus para la ampliación del lexicón de palabras semilla inicial (Hatzivassiloglou y McKeown, 1997), (Kanayama y Nasukawa, 2006).

Estos métodos más que considerarse no supervisados deberían suponerse semisupervisados, debido a que necesitan de una lista de indicadores de opinión etiquetada para calcular la polaridad. Actualmente, según Wu et al., 2010 intentan resolver el problema de la adaptación al dominio mediante un mapeado de conceptos comunes, buscando un espacio dimensional más allá del contenido léxico (Ji et al., 2011), explorando conexiones entre grafos (Wu, Tan y Cheng, 2009) o mediante métodos probabilísticos (Tan et al., 2009).

La polaridad de un texto puede verse muchas veces afectado por la presencia de ciertas construcciones lingüísticas como la negación, los cuantificadores y las formas modales.

La negación puede invertir la polaridad del texto al que afecta, mientras que los cuantificadores amplifican o disminuyen la fuerza de esa polaridad y la modalidad neutraliza la polaridad del texto.

1.2.1 La negación

La negación es un elemento lingüístico que sirve para negar un elemento oracional o una oración entera mediante un sema lexicalizado, una palabra, normalmente adverbio, o una locución.

Para conocer el alcance de la negación, es habitual asumir, que todos aquellos términos entre la señal de negación y el primer signo de puntuación tienen polaridad negativa según Pang, Lee, y Vaithyanathan, 2002. Se puede considerar también como ámbito de acción, un número fijo de términos después del término de negación (Hu y Liu, 2004). Los términos que siguen al término de negación son los llamados constituyentes.

Según el léxico afectivo General Inquirer (Stone et al., 1966) o SentiWordNet (Esuli y Sebastiani, 2006b), las negaciones son consideradas como un modificador que invierte la polaridad de las expresiones polares, de manera que éstas, en su forma negativa son transformadas en expresiones polares sin negación con la polaridad opuesta.

Al tratar la negación como un modificador de la polaridad, según Wilson et al. 2005; 2009, se modela la negación como tres tipos de variables:

– Variables de negación: representan, por ejemplo, la presencia de una negación en una ventana fija de cuatro palabras antes de la expresión polar.

– Modificadores de variable: hacen referencia a la presencia de diferentes modificadores de la polaridad, como por ejemplo “pequeño”.

– Variables de modificación de la polaridad: son palabras que no son explícitamente negaciones pero modifican las expresiones polares, como por ejemplo “desilusionado” o “esperar”.

Estas tres variables de negación, se emplean para decidir si los términos son de polaridad positiva o negativa. La polaridad de las palabras y constituyentes es obtenida mediante un léxico afectivo, y la polaridad total entre palabras y constituyentes es obtenida mediante un conjunto de reglas de inferencia para derivar dicha polaridad total de la polaridad individual de sus constituyentes. Por un lado, casi todas consideran la negación como un modificador que siempre invierte la polaridad de la opinión expresada, pero en muchos casos la negación también disminuye la fuerza de dicha polaridad. Consideremos, por ejemplo, el término de negación “no” en la oración “El futbol no es mi deporte favorito” En este caso, la negación no significa necesariamente que el emisor odie el fútbol, sino más bien que no siente entusiasmo por él. (Choi y Cardie, 2008). Por otro lado, pocos son los trabajos que intentan delimitar el ámbito de acción de la negación.

Son muchos los términos o expresiones que permiten negar una opinión. Sin embargo, la frontera entre un negador como tal y un intensificador decrementador es difusa. Ejemplos de negadores como tal, los términos “no”, “nunca” y “sin”. Otras expresiones negadoras, como “lo menos” o “en absoluto”, han sido tratadas como intensificadores.

Para resolver el sentimiento de una oración con ocurrencias de términos negativos es necesario realizar dos pasos: identificar el alcance de la negación y modificar la polaridad del fragmento de la oración correspondiente.

1.2.2 Los intensificadores

Los intensificadores son términos o expresiones que pueden modificar la polaridad y la intensidad de ciertas palabras.

Quirk et.al.(1985) clasifica los intensificadores en dos categorías principales dependiendo de su polaridad: Amplificadores, aquellos que permiten aumentar la intensidad semántica de un término próximo a éste (“muy”, “bastante”, …), y decrementadores o disminuidores si lo disminuye (“poco”, “en absoluto”,…).

El método más utilizado para la detección de cuantificadores consiste en el uso de listas de palabras que actúan como cuantificadores cuando juegan un rol gramatical determinado en la oración (modificadores adverbiales y adjetivales).

Una vez detectado los cuantificadores se les asigna un valor dependiendo de cómo modifiquen la polaridad.

Algunos investigadores en el análisis de sentimientos (Kennedy y Inkpen 2006; Polanyi y Zaenen 2006) añaden un valor a los intensificadores usando simples sumas y restas, es decir, si un adjetivo positivo tiene un valor de la intensidad de la expresión polar de 2, un adjetivo amplificado tendrá un valor de 3 y un adjetivo disminuido un 1.

En el caso de los adjetivos negativos asignan un valor de -2, que será -1 o -3 si van precedidas por cuantificadores que amplifiquen o disminuyan la expresión polar.

Este enfoque, sin embargo, presenta algunos problemas. En primer lugar, no tiene en cuenta la amplia gama de intensificadores dentro de una misma subcategoría, siendo que no todos los cuantificadores intensifican o disminuyen de la misma manera. Por ejemplo, extraordinariamente es un amplificador mucho más fuerte que bastante.

Sería necesario, por tanto, un sistema que asigne a cada cuantificador un efecto acorde a su intensidad, así como que dicho efecto se traduzca en el impacto real de dichos cuantificadores sobre los términos dentro de su ámbito de acción.

En segundo lugar, otra de las preocupaciones concierne a la amplificación de los términos que ya de por si son fuertes, pues éstos deberán incluir un mayor incremento de la intensidad global en comparación con términos más débiles. Es decir, no debe ser lo mismo para “realmente fantástico” que “realmente bien”. La intensificación debe depender también del término que se intensifica. (Toboada et.al. ,2011)

Por último, cabe mencionar que, aparte de los cuantificadores, existen otras formas de enfatizar opiniones, como el empleo de mayúsculas o de exclamaciones. Éstas pueden ser tratadas siguiendo un enfoque similar al del resto de intensificadores (Vilares, et.al., 2013).

1.2.3 La modalidad

Según la RAE (Real Academia Española), la “modalidad” es el “modo de ser o de manifestarse algo”.

La modalidad permite a las personas diferenciar entre los sucesos reales y los sucesos irreales. Por un lado, se hablaría de acontecimientos reales cuando son acciones que han pasado, están pasando o que seguro que van a pasar. Por otro lado, los acontecimientos irreales serian aquellos sucesos que podrían o probablemente deberían suceder.

Desde el punto de vista del análisis de sentimientos, en el apartado de la modalidad se estudia conocer si el uso o no de formas modales afecta a la detección de la subjetividad de los textos. Es decir, no es lo mismo indicar “El ejercicio es correcto” que “Puede que el ejercicio sea correcto”. Con la primera oración se hablaría de un suceso real, seguro; mientras que con la segunda de una acción irreal.

La modalidad puede neutralizar la polaridad de las oraciones expresadas, como puede verse con el ejemplo anterior. Es evidente que la primera oración tiene una polaridad positiva, sin embargo, en la segunda frase esto no está tan claro. Además, esta incertidumbre que aparece debido al uso de las formas modales puede también afectar al significado emocional de los textos, puede hacer que se dude a la hora de clasificar una oración como positiva o negativa.

Es por todo esto que autores como Polanyi y Zaenen (2006) creen que la modalidad es un factor importante en el análisis sentimental, ya que ésta puede afectar al analizar emocionalmente un texto, o dicho de otra manera, la modalidad puede influir en las propias tareas del análisis sentimental.

Sin embargo, hay muy pocos trabajos publicados que hayan tratado de resolver el efecto de las formas modales en los sistemas de análisis sentimental. Uno de los trabajos pioneros sobre este tema sería el realizado por Wiebe et al. (1999), donde se analiza si la aparición o no de formas modales afecta a la detección de la subjetividad. Otro autor, Brooke (2009), también analiza el uso de la modalidad en los textos afectivos, pero su estudio se centra en determinar los fragmentos de texto que contienen términos irreales para neutralizar las expresiones polares que se encuentran dentro de su ámbito de acción.

 

 

2.    Herramientas para la detección de la polaridad

2.1 Sentiment Metrics

Sentiment Metrics es una herramienta de monitoreo de social media.

Social media son las nuevas herramientas o sitios Web orientadas a comunidades (redes sociales, blogs, foros y más) para compartir información, experiencias y perspectivas a través de Internet. (Guedea, H., Flores, C., Santana, P., 2011)

Sentiment Metrics permite monitorizar y medir la social media. Está enfocado en ayudar a que las empresas puedan escuchar con claridad lo que las comunidades virtuales dicen en Internet con el objetivo de crear valor para sus clientes.

2.1.1 Características principales

Fácil configuración

Sentiment Metrics recoge conversaciones virtuales de diferentes fuentes, como Facebook y Twitter. Las menciones relevantes se presentan en tiempo real.

Las búsquedas se pueden configurar según diferentes condiciones, incluyendo la región, idioma y el canal de datos. También permite la inclusión y exclusión de determinadas urls.

Volumen de tendencia

Mediante el seguimiento de la social media se muestra si el volumen de la discusión va hacia arriba o hacia abajo con el tiempo, y poner de relieve los altos y bajos de volumen.

figura 1

Figura 1. Impacto de tendencia

Análisis sentimental

La gráfica de distribución de sentimiento permite tener una interpretación gráfica del porcentaje de menciones que son clasificadas automáticamente por el sistema como positivas (mostradas en verde), neutrales (mostradas en azul) y negativas (mostradas en rojo). El sistema de clasificación automática está disponible en varios idiomas, entre ellos el inglés y español.

 figura 2

Figura 2. Análisis sentimental

 

Identificador de influencias

Una de las cuestiones más importantes para las marcas interesadas en los medios sociales es entender quién está influyendo en los debates y la percepción de ésta en Internet.

Con la naturaleza viral de la web social, cualquier comentario negativo de una persona con una queja o problema, puede causar mucho daño.

La comprensión de quiénes son estas personas puede ser la inteligencia empresarial vital en el mundo de los negocios en línea moderna.

Sentiment Metrics incluye un informe de identificación de factor de influencia que permite clasificar influyentes basados en indicadores como la frecuencia de mención, el número de personas que siguen el objeto de análisis, o su puntuación de autoridad creada internamente. Se puede profundizar en los distintos tipos de canales, tales como blogs, foros o Micro blogs, así como ver las menciones actuales, localización, año y género.

 

Gestión de la reputación

Mediante los gráficos y tablas de datos, resulta muy fácil ver rápidamente las menciones influyentes sobre una empresa. Así mismo, puede configurarse alertas de correo electrónico cada hora para advertir de nuevas menciones, según la base de criterios que se defina. Podría ser todo lo que se mencione o simplemente aquellos que se identifiquen como negativos en Twitter, por ejemplo.

Compromiso

Sentiment Metrics ofrece la posibilidad de responder directamente a las menciones en Twitter, Facebook y otras redes / foros sociales directamente desde el panel de control. También tiene una función de “búsqueda social” con una pantalla gráfica de los perfiles en redes sociales de las personas que participan en la conversación.

2.2 Sentimentalytics

Sentimentalytics es una herramienta para el análisis de sentimientos, de redes sociales. Permite gestionar los medios sociales como son: redes sociales, blogs, microblogs y sitios de noticias.

Utiliza tecnologías semánticas para etiquetar automáticamente los tweets, posts, y noticias mostrados en los diferentes timelines, canales, consultas, etc. que aparecen en un navegador. De esta forma, Sentimentalytics destaca aquellas noticias, post, etc. que merezcan un tratamiento especial.

 figura 3

Figura 3. Ejemplo de la aplicación TweetDeck

Fuente: https://sentimentalytics.com/inicio

Esta herramienta está diseñada para Community Managers, Agencias de comunicación, y para aquellas personas preocupadas en su Marca personal.

Los medios sociales que analiza la actual versión de Sentimentalytics son: Twitter, Facebook, Google+, Google Reader, HootSuite y TweetDeck.

Se podría dividir esta herramienta en dos partes: la primera seria Emociones y etiquetas, y la segunda Navegación y volcado a fichero.

2.2.1 Emociones y etiquetas

Cuando Sentimentalytics está activada va analizando tweets/posts/noticias y les va añadiendo los emoticonos y etiquetas de entidad/polaridad/tema.

 figura 4

Figura 4. Tweet complementado con la información de Sentimentalytics.

Fuente: https://sentimentalytics.com/inicio

La información que aparece es:

–           Idioma principal del texto: para el español se utilizaría la etiqueta “es”, para el inglés la etiqueta “en” y para el francés “fr”.

–           Polaridad general del tweet/post/noticia: emoticono de color que indica en un grado de cinco niveles la polaridad encontrada (muy positiva, positiva, neutra, negativa, muy negativa) y un nivel extra para cuando no se encuentra polaridad

–           Identificación y polaridad de entidades: etiquetas con nombres de personas, empresas, lugares, usuarios de medios sociales… con la polaridad asociada a la entidad correspondiente (y con la misma escala de cinco niveles).

–           Clasificación por temas: etiquetas con las categorías temáticas en las que se puede clasificar el tweet/post

2.2.2 Navegación

Cuando esta activado Sentimentalytics, en el navegador aparece un resumen de polaridades/entidades/categorías y varias opciones de navegación:

–           Resumen y navegación por polaridad: para cada una de las polaridades identificadas por la herramienta que van desde muy positiva a no detectada, con caras de verde a gris.

 figura 5

Figura 5. Resumen y navegación por polaridad.

Fuente: https://sentimentalytics.com/inicio

–           Resumen y navegación por entidades: desplegable con los nombres identificados que pueden ser personas, empresas, organizaciones, etc…y número de apariciones de cada uno, con la posibilidad de presentarlos en pantalla filtrando el resto.

–           Resumen y navegación por categoría: desplegable con las categorías temáticas en las que se han clasificado los tweets/posts y el número de apariciones de cada una, también con posibilidad de filtro.

Además, esta herramienta tiene la opción de “Volcado a fichero”, de esta forma, el resultado del escaneado y análisis de los mensajes se puede volcar a un fichero.

Actualmente, esta herramienta está en versión beta, ésta se puede descargar gratuitamente, para ello hay que registrarse en la web https://sentimentalytics.com/inicio#.UZIFP7Vhrng.  Asimismo, en esta web aparece la opción de enviar un email con opiniones respecto dicha herramienta, hay un correo electrónico: sentimentalytics@sentimentalytics.com.

2.3 Clasificación automática de opiniones

La herramienta “Clasificación Automática de Opiniones” realiza una clasificación automática basada en la opinión de los documentos multilingües, para ello procesa el texto proporcionado determinando si expresa o no una opinión.

La clasificación de opinión asigna cada documento a una categoría predefinida de acuerdo a la polaridad de su información subjetiva, en este caso se emplean tres categorías distintas: Opinión Positiva, Negativa y No Opinión. Cuando se trata de las dos primeras categorías también se calcula para cada uno de los documentos analizados un valor porcentual que indica el grado de intensidad de la opinión.

Para llevar a cabo el procesamiento de los textos se utilizan diccionarios que contienen información semántica asociada a cada palabra o conjunto de palabras. De esta manera a cada término de un diccionario le corresponde un valor que indica si se trata de un término positivo o negativo y el grado de intensidad correspondiente. Además existirán términos cuyo valor únicamente modificará el grado de intensidad de otros términos o incluso su polaridad. Los diccionarios que se utilizan actualmente son para los siguientes idiomas: español, inglés, francés, catalán, euskera y gallego.

Esta herramienta está basada en la familia “STILUS” de productos de tecnología lingüística, que ofrece funcionalidad para la clasificación automática de opiniones, a partir de la información semántica del texto. El algoritmo de clasificación emplea un modelo basado en palabras clave, siguiendo los siguientes pasos:

  • Extracción de los indicadores de opinión y separación del texto en sintagmas para su posterior procesamiento.
  • Modificación del grado de intensidad de los indicadores para cada uno de los sintagmas.
  • Inversión de la polaridad de los indicadores correspondientes mediante el uso de los marcadores de polaridad.
  • Clasificación del texto en función de unos umbrales de decisión que dependen del idioma.

Como resultado del proceso de clasificación se exhibe, junto con el valor que indica el grado de intensidad de la opinión, una lista con los términos empleados y excluidos del análisis.

2.4 Sentiwordnet y wordnet

2.4.1 WordNet

WordNet (Fellbaum, 1998) es una base de datos léxica del Inglés. Agrupa palabras en conjuntos de sinónimos llamados synsets, facilitando definiciones cortas y generales, además, almacena las relaciones semánticas entre los conjuntos de sinónimos. Su finalidad es: producir una combinación de diccionario y tesauro cuyo uso sea más intuitivo, y sostener análisis automático de texto y aplicaciones de Inteligencia Artificial.

WordNet se ha utilizado para diferentes y numerosos proyectos en sistemas de información, que incluyen desambiguación del significado de palabras, recuperación de información, clasificación automática de texto, resumen automático de texto y traducción automática.

2.4.2 SentiWordNet

El recurso lingüístico SentiWordNet ha sido desarrollado recientemente para la comunidad de investigación (Esuli & Sebastiani, 2006; Baccianella et al., 2010). Es un recurso lexical que agrega información de opiniones a los sentidos de la palabra en la base de datos WordNet. En SentiWordNet cada sentido de una palabra tiene tres calificaciones numéricas para la objetividad, subjetividad y neutralidad del significado de una palabra. Cada calificación se encuentra entre 0 y 1, y su suma total sebe dar 1. La dificultad en utilizar SentiWordNet, se debe a que una palabra localizada en un texto, tiene que ser desambiguada antes de que sus calificaciones puedan ser utilizadas. Por ejemplo, un adjetivo como la palabra “bueno” tiene 24 interpretaciones o significados diferentes en SentiWordNet (por ejemplo, bueno como sinónimo de “bien” o como sinónimo de “justo”), por eso, desambiguar la ocurrencia de la palabra “bueno” en un texto sería una tarea difícil.



3.    Prueba de la herramienta Sentimentalytics

Como ejemplo de análisis sentimental, se ha realizado una prueba con la aplicación Sentimentalytics. El motivo de elección de esta herramienta se debe a que se trata de una aplicación gratuita y de fácil utilización.

Al realizar la prueba, se ha observado que la aplicación indica el idioma y marca en diferentes colores los distintos tipos de comentarios según sean positivos o negativos.

figura 6Figura 6. Vista general de la aplicación Sentimentalytics en Facebook.

El programa está en fase beta, probablemente por esta razón se han detectado algunos fallos en la aplicación como:

  • Ralentización de la red social. Al cargar en Facebook Sentimentalytics, ésta hace que Facebook funcione más lento de lo habitual.
  • Fallo en la clasificación de comentarios. En algunos momentos no se muestra el análisis sentimental, es decir, no aparecen clasificados los comentarios en positivo, negativos o neutros.
  • Necesidad de reiniciar la aplicación. Cuando se introducen nuevos comentarios es necesario actualizar la red social para que vuelva a realizar el análisis.
  • Los comentarios secundarios no son analizados por la herramienta. Ésta solo se centra en los comentarios principales.

A continuación se muestran los resultados obtenidos tras la prueba realizada en la red social Facebook en un grupo creado para este trabajo.

Como se aprecia en las imágenes analiza incorrectamente algunos comentarios, ya que en este caso se trata de un comentario positivo y la aplicación lo marca como negativo.

figura 7

Figura 7. Ejemplo error de análisis sentimental.

En la siguiente figura se muestra un ejemplo de un comentario “muy” negativo detectado por Sentimentalytics.

figura 8

Figura 8. Ejemplo de comentario “muy” negativo.

Cuando la aplicación no puede clasificar un comentario lo indica con el icono de la cara en blanco.

 figura 9

Figura 9. Ejemplo de comentario sin catalogar.

Al incluir nombres o palabras en mayúscula, Sentimentalytics los considera palabras destacadas como categorías y entidades, destacándolas en color lila (figura 10) y en color azul respectivamente.

 figura 10

Figura 10. Ejemplo de palabras destacadas.

En la siguiente figura se muestra un ejemplo de un comentario “muy” positivo detectado por Sentimentalytics.

 figura 11

Figura 11. Ejemplo de comentario “muy” positivo.

Un ejemplo de un comentario neutral detectado por Sentimentalytics se muestra a continuación.

 figura 12

Figura 12. Ejemplo de comentario neutro

 

Tras utilizar la aplicación, se han observado algunas ventajas que cabe destacar:

  • Se ordenan los comentarios por icono seleccionado, por ejemplo, si seleccionamos el icono de la cara roja, la aplicación recopilará todos estos comentarios, mostrándolos en la propia red social.
  • La aplicación permite realizar búsquedas sobre entidades y categorías, recopilándolos y mostrándolos en la propia red social.

Para poder analizar mejor esta herramienta, se decidió aplicarla además, en Google Reader, para comparar su comportamiento en diferentes ámbitos. Google Reader permite organizar y acceder rápidamente desde una interfaz web a todas las noticias de las páginas configuradas en el sistema que soporten.

Como se puede observar en la figura 13, la aplicación Sentimentalytics repite los resultados analizados. Esto se debe a que es un problema de la versión beta.

 figura 13

Figura 13. Ejemplo de análisis en Google Reader

 

 

4.    Conclusiones

Ante la necesidad de información sobre esta área del conocimiento tras la asignación del tema, se vio oportuno empezar por la búsqueda en bruto de información al respecto.

Una vez se ubicó la temática dentro del área del análisis sentimental, se profundizó en los aspectos considerados más relevantes de la polaridad semántica.

A través de la información recogida en diferentes tesis y trabajos, se ha detectado una falta de estudios en algunos de los aspectos que afectan a la detección de la polaridad semántica. Por ejemplo, como se ha mencionado anteriormente, aspectos como la presencia de ciertas construcciones lingüísticas tales como negación y la modalidad no han sido estudiados en profundidad, presentando aún en la actualidad deficiencias en los sistemas.

Además, existen muy pocas aproximaciones que hayan estudiado otros modificadores no tan frecuentes como la ironía y el sarcasmo, que del mismo modo pueden afectar a la interpretación de la carga emotiva del texto, puesto que no existen modelos conceptuales sobre cómo se expresan y el efecto que producen.

En cuanto a los ámbitos de aplicación de los sistemas que analizan la polaridad semántica, como las herramientas presentadas a lo largo del trabajo, se determinan su utilidad para el marketing digital y el comercio electrónico.

De hecho, la aplicación del análisis de la polaridad semántica en el marketing digital, fue el motivo por el que se escogió este tema, pues tenemos perspectivas de continuar los estudios en esta dirección.

En el ámbito del comercio electrónico y el marketing digital, se pretende exprimir al máximo toda la información existente en la web sobre los usuarios para satisfacer en la medida de lo posible sus necesidades.

Actualmente, el volumen de comentarios en la red es muy elevado, por lo que una persona no tiene la capacidad de procesar de forma manual todos los contenidos. Por tanto, es necesario tener herramientas que ayuden a procesar de forma automática todas las opiniones de interés ahorrando en recursos (humanos, económicos, etc.). Probablemente las opiniones negativas sean las más interesantes, ya que ante una gran cantidad de información resulta conveniente conocer las opiniones de los usuarios disgustados con los productos o servicios de la empresa que puedan extender los comentarios negativos por la red, mientras que los positivos no son tan urgentes de atender.

Otro aspecto importante para el comercio electrónico es el conocimiento de la reputación online. Las herramientas de medición de las interacciones de los usuarios con las marcas y sus productos a través de los medios sociales, permiten un análisis concreto de aquellos temas que se quieren conocer tratando de realizar un análisis sentimental que, además de leer lo que el usuario escribe, interprete el sentimiento del comentario.

 

5.    Referencias

1. Análisis De Sentimiento, Análisis De Medios Sociales | Sentimentalytics. Available from: https://sentimentalytics.com/inicio#.UYzUzbUvWik.

2. Google Reader. Available from: http://www.google.es/reader/view/#overview-page.

3. Facebook. Available from: https://www.facebook.com/.

4. BALBACHAN, F. and DELL’ERA, D. Análisis Automatizado De Sentimiento En Textos Breves De La  Plataforma Twitter. Revista De Lingüística Informática, Modelización e Ingeniería Lingüística (Infosur), 2012, no. 6. pp. 3-14 ISSN 1851-1996.

5. CARRILLO DE ALBORNOZ CUADRADO, J. Un Modelo Lingüístico-Semántico Basado En Emociones Para La Clasificación De Textos Según Su Polaridad e Intensidad. Madrid: Universidad Complutense de Madrid, 2011.

6. J. GALAN. Sentimentalytics Herramienta Semántica Para Redes Sociales. 01/08/2012, 2012 Available from: http://www.josegalan.es/sentimentalytics-herramienta-semantica-para-redes-sociales/.

7. J.C. GONZÁLEZ, J.R. VELASCO and L. MAGDALENA. Clasificación Automática De Opiniones. Daedalus-Data, Decisions and Language. 12 de diciembre de 2011, 2011 Available from: http://showroom.daedalus.es/es/tecnologias-de-la-lengua/opinioncl/.

8. GUEDEA NORIEGA, H.H., FLORES CORTÉS, C.A. and SANTANA, P.C. La Contribución del Social Media En Campañas Políticas. Memorias del 4to Congreso Internacional en Ciencias Computacionales CiComp. ed., Ensenada, Baja California ed. Universidad Autónoma de Baja California, 2011 ISBN 978-607-607-037-6.

9. M. LIRA. Monitoreo En Social Media – Un Vistazo a Sentiment Metrics. 12 de diciembre de 2012, 2012 Available from: http://www.dosensocial.com/2012/12/12/monitoreo-en-social-media-un-vistazo-a-sentiment-metrics/.

10. MONTEJO-RÁEZ, A., MARTÍNEZ-CÁMARA, E., MARTÍN-VALDIVIA, M.T. and UREÑA-LÓPEZ, L.A. Detección De La Polaridad En Citas Periodísticas: Una Solución no Supervisada. Sociedad Española Para El Procesamiento Del Lenguaje Natural. Universidad de Jaén. Departamento de Informática. ed., 6 de Septiembre de 2012, 2012, vol. 49. pp. 149-156 ISSN 1135-5948.

11. Real Academia Española. Diccionario De La Lengua Española – Vigésima Segunda Edición. 2013 Available from: http://www.rae.es/rae.html.

12. SAGGION, H. Procesamiento Del Lenguaje Natural Para El Análisis Del Lenguaje Subjetivo. Subjetividad y Procesos Cognitivos, 2010, vol. 14, no. 2. pp. 247-259 ISSN 1852-7310.

13. Sentiment Metrics. Sentiment Metrics. 2010 Available from: http://www.sentimentmetrics.com/.

14. TABOADA, M., et al. Lexicon-Based Methods for Sentiment Analysis. Computational Linguistics, junio 2011, 2011, vol. 37, no. 2. pp. 267-307 ISSN 0891-2017.

15. VILARES, D., ALONSO, M.A., and GÓMEZ-RODRÍGUEZ, C. Clasificación De Polaridad En Textos Con Opiniones En Español Mediante Análisis Sintáctico De Denpendencias. Procesamiento Del Lenguaje Natural. Sociedad Española para el Procesamiento del Lenguaje Natural ed., 2013, vol. 50. pp. 13-20 ISSN 1135-5948.

16. The Free Encyclopedia. WIKIPEDIA. Sentiment Analysis. 12 de abril del 2013, 2013 Available from: http://en.wikipedia.org/wiki/Sentiment_analysis.

17. The Free Encyclopedia. WIKIPEDIA. Wordnet. 6 de mayo del 2013, 2013 Available from: http://es.wikipedia.org/wiki/WordNet.

18. The Free Encyclopedia. WIKIPEDIA. Negación (Gramática). 12 de abril del 2013, 2013 Available from: http://es.wikipedia.org/wiki/Negaci%C3%B3n_(gram%C3%A1tica).

Publicado en Sin categoría