Ciencias de la Computación e Inteligencia Artificial

Evaluación de la ciencia

TítuloNº AlumnosTutor/esCategorías
Sistemas Distribuidos para la Detección y Análisis de Comunidades en Información Científica 1 Antonio Gabriel López Herrera

Análisis de datos
Bases de datos
Desarrollo web
Evaluación de la ciencia
Gestión Bibliográfica
Minería de datos
Preprocesamiento de datos
Procesamiento de Leng. Natural
Programación paralela/distribuida
Recuperación de información
Redes complejas
Redes sociales
Web 2.0
Descripción

La cienciometría (o bibliometría aplicada   a la ciencia), es una disciplina cuyo elemento de trabajo es la información científica (fundamentalmente contenida en artículos de revista, contribuciones a congresos, etc.),  y cuyo objetivo es la extracción de conocimiento a partir de dicha información. De manera resumida, nos encontramos con dos tipos de cienciometría, cienciometría básica (de corte más estadístico) cuyo objetivo es la obtención de resúmenes (número de artículos, número de autores, números de citas, etc.) de la información científica; y la cienciometría avanzada, cuyo principal objetivo es la elaboración de resumen más sofisticados, que suelen finalizar con una representación visual, donde la estructura de red suele tener un papel destacado.

En el ámbito de la cienciometría avanzada, existen numerosas, técnicas, herramientas y algoritmos para extraer y/o visualizar la estructura de red subyacente en un conjunto de documentos científicos [1,2,3]. Cuando el conjunto de documentos no es muy grande, y la red subyacente es de pequeño tamaño, prácticamente cualquier algoritmo, técnica o herramienta es capaz de obtener buenos resultados,  y la representación asociada suele ser suficientemente ilustrativa. Sin embargo, cuando la cantidad de documentos a analizar es lo suficientemente grande, los resultados pueden variar significativamente dependiendo del enfoque/método utilizado. En estas situaciones es donde la selección de la técnica, algoritmos y herramienta/as a utilizar tiene una influencia definitiva en los resultados obtenidos. La determinación de qué enfoque usar en cada situación y de qué forma, necesita del conocimiento experto del analista, que en muchos casos, se expresa en forma deknow-how.

En trabajos previos desarrollamos la herramienta SciMAT (Science Mapping Analysis Software Tool) [1], cuyo objetivo principal es la extracción y visualización de diferentes tipos de redes a partir de documentos científicos.

Aunque SciMAT es capaz de trabajar con 20 tipos diferentes de redes (interviniendo diferentes actores de la ciencia: autores, palabras clave, referencias, revistas, etc.),está especializada en el análisis de palabras clave, es ahí donde la herramienta explota su máximo potencial, permitiéndonos detectar grupos de interés (temas y redes temáticas). Si bien, los algoritmos en SciMAT para la extracción de los diferentes tipos de redes son los mismos, la interpretación que por ejemplo se puede hacer de una red de palabras clave es semánticamente diferente de la interpretación que podríamos hacer de una red de autores (basada en co-citación, co-autoría, etc.). Además, la representación que por defecto incorpora SciMAT para la redes de palabras es de difícil aplicación para el caso de las redes de autores.

El objetivo del presente trabajo fin de máster es dar un paso más allá, con la idea de aumentar la potencialidad de SciMAT a la hora de manejar redes de autores (o comunidades de interés como se conoce en la literatura). Esta mejora/extensión de SciMAT, tiene como objetivos particulares la incorporación de nuevos algoritmos para la extracción de redes, y subredes, la mejora de la visualización de las redes/subredes obtenidas. Y fundamentalmente, el desarrollo de una nueva metodología para la detección de comunidades sociales ocultas de co-autoría y co-citación a partir de información científica.

Tareas

             Las redes de autores, son naturalmente redes sociales, y en ese sentido, pensamos que a vances realizados para el análisis y síntesis de redes sociales serán de aplicación natural al caso particular del análisis de redes de autores extraídas de la información científica. Así, tareas que se realizarán durante el proyecto serán:

-   Estudio de métodos y técnicas para el análisis de redes sociales en general.

-Puesta en práctica y aplicación de los métodos seleccionados al caso particular de las redes de autores provenientes de documentación científica.

- Dsarrollo de una metodología, basada en el análisis de redes sociales, para la fácil extracción, análisis  y visualización de comunidades de interés a partir de documentación científica.

- Incorporación/mejorade SciMAT, o creación de una nueva herramienta, con los desarrollos obtenidos.  



[1]    http://sci2s.ugr.es/scimat

Conocimientos Previos

Bases de datos

Lenguajes de programación: Java, PHP