Ciencias de la Computación e Inteligencia Artificial

Recuperación de información

TítuloNº AlumnosTutor/esCategorías
Vigilancia Tecnológica y Análisis de Opiniones en Redes Sociales 1 Antonio Gabriel López Herrera

Bases de datos
Procesamiento de Leng. Natural
Recuperación de información
Redes sociales
Software Mining
Web 2.0
Descripción

Con el advenimiento de las nuevas TIC, soportadas en la Web 2.0, millones de personas crean billones de conexiones a través de los medios sociales cada día; con cada click y cada tecla que se pulsa se crean relaciones que, de manera agregada, forman una vasta red social. Usuarios de herramientas de comunicación social (email, blogs, microblogs, wikis, ...) envían de manera ferviente mensajes personales o públicos, publican enérgicamente opiniones sobre algún producto, alguna persona o evento, o contribuyen altruistamente a la comunidad de conocimiento para realizar colaboraciones, promover la herencia cultural, o avanzar en el desarrollo de algún producto o idea.

Apasionados de las redes sociales crean y comparten (textos, imágenes, vídeos, enlaces, …) y valoran o recomiendan productos, personas y servicios contando sus experiencias; proporcionando ayuda a otras personas (sean vecinos o vivan en el otro extremo del mundo), y expresando su creatividad (por ejemplo, fotos en Flickr o Instagram; vídeos en YouTube o Vimeo; …); contribuyendo así a la Inteligencia Colectiva de la Web.

El resultado de todo esto son vastas y tremendamente complejas redes de conexiones que relacionan personas con otras personas, documentos, localizaciones, conceptos, y toda clase de objetos (principalmente digitales).

Nuevas herramientas de minería de opiniones son ahora más que nunca necesarias para recopilar, analizar, visualizar y generar conocimiento profundo (en forma de insights) a partir de los conjuntos de conexiones formadas de millones de mensajes, links, posts, ediciones, actualizaciones de fotos y vídeos, revisiones y recomendaciones de productos. Estas herramientas podrían ayudar a empresas en varios sentidos:

 

  • A conocer qué se dice (ya sea bueno o no tan bueno) sobre los productos, servicios, departamentos de la empresa, o incluso de la propia empresa, en qué sentido versan las opiniones de los ya clientes o de los potenciales consumidores.

 

  • A conocer qué están haciendo empresas competidoras en el sector, a conocer cuáles son los productos más relevantes en base a las opiniones positivas y buenos comentarios en las redes sociales.

 

    • A detectar los posibles nichos de actuación, tanto a corto como a medio plazo, en los que la empresa pueda desmarcarse de sus competidores. Por ejemplo, un fabricante (o incluso distribuidor) de dispositivos móviles podría sondear los medios sociales y detectar que los consumidores valoran positivamente las pantallas grandes (o por el contrario negativamente las pequeñas) y en base a ello adelantarse al mercado y en consecuencia producir (o adquirir) nuevos dispositivos con estas características.
    • También podrían servir para localizar qué personas o grupos son los que más activamente interaccionan con la red (tienen muchos seguidores y aportan muchas y razonadas revisiones de productos), y por tanto influyendo en su entorno.

 

En el proyecto que solicitamos desarrollaremos una herramienta software para el análisis masivo de datos procede de diferentes medios sociales, cuyas principales características serán:

 

  • Poder agregar datos procedentes de diferentes medios sociales,
  • Poder realizar análisis combinados tanto de personas, como de objetos (productos, servicios, etc.), como de comentarios,
  • Que permita detectar el sentido (positivo, negativo o neutral) en el que giran los comentarios, cuantificando el grado en el que son positivos o negativos, así como predecir patrones de comportamiento a partir de dicha información.
  • Que permita realizar todo en una misma aplicación (descarga de datos, preprocesamiento, análisis y visualización).

Para más información contactar con el profesor.

Conocimientos Previos

Bases de datos

Lenguajes de programación: Java, R y/o Python

Material

Ninguno

Desarrollo de interfaces gráficos avanzados para visualización de información científica 1 Antonio Gabriel López Herrera
Manuel Jesús Cobo Martín (Ingeniería Informática (Univ. de Cádiz))

Bases de datos
Evaluación de la ciencia
Gestión Bibliográfica
Interfaces gráficas
Recuperación de información
Descripción

Se pretende evolucionar la herramienta para el análiisis de mapas científicos SciMAT(http://sci2s.ugr.es/scimat) a fin de:

- mejores gráficos y representaciones avanzadas de resultados

- adquisición automática e integrada de datos bibliográficos procedentes de diferentes fuentes de información (Web of Science, Scopus, ...)

- generación de informes avanzados.

Para más información contactar con el profesor.

Conocimientos Previos

Java

Bases de datos relacionales y NoSQL

Material

Ninguno

Desarrollo de un sistema de recomendación de revistas científicas 1 Luis Miguel de Campos Ibáñez
Juan Francisco Huete Guadix

Clasificación automática
Gestión Bibliográfica
Preprocesamiento de datos
Recuperación de información
Descripción

El objetivo es desarrollar un sistema que, dado un artículo que un investigador trata de publicar en una revista científica (título, abstract y tal vez su texto completo), pueda recomendar, de acuerdo al contenido del artículo, cuál son las revistas más apropiadas para publicarlo. Para ello habrá que extraer información de los artículos de las diferentes revistas en una base de datos documental como SCOPUS o PUBMED para que sirvan de datos de entrenamiento, y posteriormente construir clasificadores de texto (donde las clases son las revistas). Alternativamente se puede construir un sistema de recuperación de información, donde la consulta la forma el artículo a publicar, y los documentos los artículos de la base de datos documental.

Conocimientos Previos

Sistemas de recuperación de información, técnicas de clasificación

Material

Bases de datos documentales de revistas, software libre de recuperación de información y clasificación.