Guía docente de la asignatura

Recuperación de Información

Curso 2021 / 2022
Fecha última actualización: 21/06/2021
Fecha de aprobación: 21/06/2021

Grado

Grado en Ingeniería Informática (Ceuta)

Rama

Ingeniería y Arquitectura

Módulo

Formación de Especialidad 4: Sistemas de Información

Materia

Sistemas de Información en Web

Curso

4

Semestre

1

Créditos

6

Tipo

Obligatoria

Profesorado

Teoría

  • Carlos Cano Gutiérrez. Grupos: A
  • Francisco Javier Rodríguez Díaz. Grupos: A

Tutorías

Carlos Cano Gutiérrez

carloscano@ugr.es
  • Primer semestre
    • Lunes de 15:30 a 17:30 (Ceuta)
    • Martes de 10:00 a 14:00 (Ceuta)
  • Segundo semestre
    • Martes de 10:00 a 14:00 (Ceuta)
    • Miércoles de 10:00 a 12:00 (Ceuta)

Francisco Javier Rodríguez Díaz

fjrodriguez@ugr.es
  • Primer semestre
    • Jueves de 10:30 a 13:30 (Ceuta)
    • Miércoles de 10:30 a 13:30 (Ceuta)
  • Segundo semestre
    • Martes de 15:30 a 21:30 (Ceuta)

Prerrequisitos y/o Recomendaciones

No es necesario que los estudiantes tengan aprobadas asignaturas, materias o módulos previos como requisito indispensable para cursar este módulo. No obstante, se recomienda la superación de los contenidos y adquisición de competencias de las materias de formación básica y de rama, en especial las relacionadas con la programación.

Breve descripción de contenidos (Según memoria de verificación del Grado)

  • Modelos de Recuperación de Información.
  • Indexación. 
  • Recuperación de Información Web.
  • Agrupamiento y clasificación textual.

 

Competencias asociadas a materia/asignatura

Competencias generales

  • CG03 - Capacidad para diseñar, desarrollar, evaluar y asegurar la accesibilidad, ergonomía, usabilidad y seguridad de los sistemas, servicios y aplicaciones informáticas, así como de la información que gestionan.
  • CG04 - Capacidad para definir, evaluar y seleccionar plataformas hardware y software para el desarrollo y la ejecución de sistemas, servicios y aplicaciones informáticas.

Resultados de aprendizaje (Objetivos)

Objetivos formativos particulares

  • Adquirir las destrezas, conocimientos y técnicas básicas para buscar información textual.
  • Entender el concepto de modelo de recuperación de información.
  • Adquirir una visión general del proceso de recuperación de información, así como de sus objetivos.
  • Conocer los diferentes componentes de un sistema de recuperación de información, su funcionamiento y relaciones entre ellos.
  • Comprender las peculiaridades de la recuperación de información estructurada con un lenguaje de marcado y las similitudes y diferencias con la recuperación de información clásica.
  • Identificar los elementos que conforman la Web, así como conocer su estructura.
  • Conocer las técnicas específicas para la recuperación de información en la Web.
  • Asumir la importancia de la recuperación de información en el diseño y desarrollo de sistemas de información.
  • Analizar problemas de acceso de información en el marco de los sistemas de información y diseñar e implementar un sistema de recuperación de información que les dé solución.
  • Ser capaz de integrar un sistema de recuperación de información en un sistema de información.

Objetivos formativos de carácter general.

  • Tener la capacidad de integrar soluciones de Tecnologías de la Información y las Comunicaciones y procesos empresariales para satisfacer las necesidades de información de las organizaciones, permitiéndoles alcanzar sus objetivos de forma efectiva y eficiente, dándoles así ventajas competitivas.
  • Ser capaz de participar activamente en la especificación, diseño, implementación y mantenimiento de los sistemas de información y comunicación.

Programa de contenidos teóricos y prácticos

Teórico

  • Tema 1. Introducción a la recuperación de información.
    • Definición de recuperación de información. Componentes de un sistema de recuperación de información y sus relaciones.
  • Tema 2. Procesamiento de texto.
    • Fuentes de datos y adquisición de documentos. Procesamiento de documentos y términos. Segmentación y lematización. Pesado de términos
  • Tema 3. Modelos de recuperación.
    • Concepto de modelo de recuperación. Modelo booleano. Modelo vectorial. BM25. Modelado de Lenguaje.
  • Tema 4. Evaluación de la recuperación.
    • Conceptos básicos. Eficacia, eficiencia. Relevancia. Satisfacción de usuario. Precisión y exhaustividad. Medidas de la eficacia a partir de la curva precisión-exhaustividad. Medidas que consideran el orden.
  • Tema 5. Indexación de documentos.
    • El proceso de indexación de documentos. Índices Invertidos. Indexación distribuida
  • Tema 6. Recuperación de información Web.
    • Características de la recuperación de información en la Web.  Arañas. Reordenación de resultados basado en el análisis de enlaces. Posicionamiento Web.
  • Tema 7. Clasificación y Agrupamiento documental.
    • Concepto de clasificación y agrupamiento documental, algoritmos básicos.

 

Práctico

  • Unidad P0:  Búsqueda de información en la Web.
  • Unidad P1: Indexación y Búsqueda con un motor de código abierto: Lucene
    • Práctica 2. Procesamiento de Textos.
    • Práctica 3. Diseño y desarrollo de un sistema de recuperación de información e implementación de un buscador utilizando Lucene.
      • P3.1 Indexación
      • P3.2 Búsqueda
  • Unidad P2: Introducción a Solr.

SEMINARIOS

  • Seminario 1: Estrategias de búsqueda de información en la Web.
  • Seminario 2: Sistemas de recuperación de información actuales.
  • Seminario 3: Sistemas de Recomendación: Una aplicación sobre grandes datos.

 

 

Bibliografía

Bibliografía fundamental

  • Cacheda F. Fernández-Luna,JM and Huete, J. Recuperación de Información: Un enfoque práctico y multidisciplinar. Ed. Rama 2011.
  • M. McCandless, E. Hatcher and O. Gospodnetic. Lucene in Action (2d Edition) Manning 2011.
  • Manning, P. Raghavan, and H. Schütze. Introduction to Information Retrieval, C. Cambridge University Press, 2008.
  • Bruce Croft, Donald Metzler, Trevor Strohman, “Search Engines: Information Retrieval in Practice:” Addison Wesley/Prentice Hall, 2010.
  • Baeza-Yates R. and Ribeiro-Neto B., "Modern Information Retrieval", Addison Wesley 1999.
  • ChengXiang Zhai t Sean Massung. Text Data Management and Analysis. A practical introduction to Information Retrieval and text mining. ACM & Morgan Claypool Pubs. 2016

Bibliografía complementaria

  • Goker, J. Davies. Searching in the 21st century. Wiley. 2009.
  • Feldman, R. and Sanger, J. The Text Mining Handbook: Advanced Approaches in Analyzing Unstructured Data.Cambridge U. Press, 2006.
  • D. A. Grossman, O. Frieder, Information Retrieval: Algorithms and Heuristics, Springer. 2004.
  • Belew Richard K., "Finding Out About. A Cognitive perspective on Search Engine Technology and the WWW", Cambridge University Press, 2000.
  • Witten I. H., Moffat A., Bell T. C., Managing Gigabytes, Compressing and Indexing Documents and Images. 2nd Edition, Morgan Kaufmann, 1999.
  • W. B. Frakes and R. Baeza-Yates, Information Retrieval: Data Structures & Algorithms, Prentice-Hall, 1992.
  • Salton, Automatic Text Processing, Addison-Wesley, 1989.
  • Van Rijsbergen, Information Retrieval, Second Edition, Butterworth, 1979.

Metodología docente

  • MD01 Lección Magistral (Clases Teóricas-Expositivas) 
  • MD02 Actividades Prácticas (Resolución de Problemas, Resolución de Casos Prácticos, Desarrollo de Proyectos, Prácticas en Laboratorio, Taller de Programación, Aula de Informática, Prácticas de Campo). 
  • MD03  Seminarios (Debates, Demos, Exposición de Trabajos Tutelados, Conferencias, Visitas Guiadas, Monografías). 
  • MD04 Actividades no presenciales Individuales. 
  • MD05 Actividades no presenciales Grupales. 
  • MD06 Tutorías Académicas. 

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final)

Evaluación ordinaria

Todo lo relativo a la evaluación se regirá por la Normativa de evaluación y calificación de los estudiantes vigente en la Universidad de Granada, que puede consultarse en:

https://secretariageneral.ugr.es/bougr/pages/bougr71/ncg712/!.

Régimen de Asistencia.

Para considerar el sistema de evaluación continua, el estudiante deberá asistir al menos a un 80% de las clases teóricas y prácticas. Será necesario asistir a las clases prácticas en las que se realicen la evaluación de trabajos.

La evaluación seguirá las siguientes pautas:

Evaluación Continua:

  • Para la parte teórica se realizará mediante pruebas escritas cuya ponderación total es del 50% de la asignatura.
  • Para la parte práctica se realizarán prácticas de laboratorio, resolución de problemas y desarrollo de proyectos, y se valorarán las entregas/presentaciones de las memorias realizadas por los alumnos. La ponderación de este bloque es del 40%.
  • La parte de trabajo autónomo y los seminarios se evaluarán teniendo en cuenta la asistencia, los problemas propuestos que hayan sido resueltos y entregados por los alumnos y la presentación oral de los trabajos desarrollados. La ponderación es del 10%.

La calificación global será una calificación numérica obtenida mediante la suma ponderada de las calificaciones obtenidas en cada parte

Evaluación extraordinaria

Todo lo relativo a la evaluación se regirá por la Normativa de evaluación y calificación de los estudiantes vigente en la Universidad de Granada, que puede consultarse en:

https://secretariageneral.ugr.es/bougr/pages/bougr71/ncg712/!.

La evaluación en convocatorias extraordinarias se realizará en una prueba única que se valorará en el rango 0 a 10, donde se incluirá tanto la parte teórica como práctica. En el caso en que el alumno haya podido seguir el sistema de evaluación continua en el año en curso se podrá considerar dicho esquema (ponderando la calificación de la parte teórica de la prueba al 50% de la nota final y respetando las calificaciones obtenidas en los otros apartados por el alumno en la evaluación continua). La calificación del alumno será el máximo entre las calificaciones obtenidas por cada sistema de evaluación, continua (si procede) y prueba única.

Evaluación única final

De acuerdo a lo establecido en la Normativa de evaluación y de calificación de los estudiantes de la Universidad de Granada aprobada en Consejo de Gobierno de 20 de mayo de 2013 (NCG71/2), la evaluación será preferentemente continua. No obstante, el estudiante que no pueda acogerse a dicho sistema por motivos laborales, estado de salud, discapacidad o cualquier otra causa debidamente justificada podrá acogerse a la evaluación única final. Para ello deberá solicitarlo al director del Departamento o al Coordinador del Máster en las dos primeras semanas de impartición de la asignatura o, excepcionalmente, en las dos primeras semanas tras la matriculación en la asignatura (NCG78/9: Instrucción relativa a la aplicación del artículo 8.2). La normativa se puede consultar en https://secretariageneral.ugr.es/pages/normativa/fichasugr/ncg7121 .

Esta modalidad de evaluación se realizará en un único acto académico el día de la convocatoria oficial de examen para la asignatura. Dicha prueba (evaluada de 0 a 10) incluirá preguntas tanto de tipo teórico como práctico que garanticen que el alumno ha adquirido la totalidad de las competencias descritas en esta misma guía docente, incluyendo aquellas herramientas software utilizadas en la parte práctica de la asignatura.

Información adicional

No es necesario que los estudiantes tengan aprobadas asignaturas, materias o módulos previos como requisito indispensable para cursar este curso. No obstante, se recomienda la superación de los contenidos y adquisición de competencias de las materias de formación básica y de rama, en especial las relacionadas con la programación.

 

ESCENARIO A (ENSEÑANZA-APRENDIZAJE PRESENCIAL Y TELE-PRESENCIAL)

Horario (Según lo establecido en el POD)

El horario de tutorías se podrá consultar en el siguiente enlace

https://decsai.ugr.es/index.php/docencia/profesorado

así como en el directorio de la UGR

https://directorio.ugr.es

Herramientas para la atención tutorial (Indicar medios telemáticos para la atención tutorial)

La atención tutorial se realizará preferentemente online mediante las plataformas y herramientas que recomiende la Universidad de Granada.

Medidas de adaptación de la evaluación (Instrumentos, criterios y porcentajes sobre la calificación)

El profesorado de la asignatura adaptará, total o parcialmente, los contenidos para su impartición online en los horarios establecidos por el centro.

Esta adaptación estará sujeta a los condicionantes de infraestructura y medios que existan en el momento de adopción del escenario telepresencial, en cualquier caso se garantizará que los alumnos que no puedan asistir presencialmente puedan recibir el mismo contenido que los que si presentes. Para ello, se utilizarán las plataformas y herramientas proporcionadas por la Universidad de Granada.

En el contexto telepresencial se aplicarían las siguientes adaptaciones:

  • La proporción entre clases virtuales y presenciales dependería del centro y circunstancias sanitarias, tanto para la teoría como para las prácticas. En las clases virtuales se impartirían los conocimientos más generales, en las presenciales se primaría la impartición de los más específicos, así como la resolución de ejercicios.
  • Dada la tipología del trabajo realizado en prácticas, estas sesiones, se podrían impartir y desarrollar de forma virtual, dejando las clases presenciales para resolver problemas específicos que se planteen en el desarrollo de las mismas o resolución de ejercicios por parte de los alumnos

Evaluación ordinaria

Considerando la metodología de evaluación expuesta, no es necesario ningún cambio con la única salvedad de que, si no fuera posible celebrar la defensa de las prácticas de forma presencial, se realizaría a distancia y de forma síncrona haciendo uso de las herramientas oficiales habilitadas por la UGR. En cualquier caso, la evaluación de las distintas pruebas se realizará eminentemente presencial ajustando las fechas de los actos de defensa de forma que se adecue a las condiciones sanitarias establecidas y respetando las fechas dadas por la propia titulación.

Evaluación extraordinaria

Dada la metodología de evaluación considerada, no es necesario ningún cambio. Si no fuera posible evaluar de forma presencial, se realizaría un examen multi-pregunta a distancia para la parte teórica de la asignatura y una prueba práctica, también telemática, de la parte práctica para aquellos estudiantes que tengan/quieran mejorar la calificación obtenida en prácticas en la convocatoria ordinaria. Se mantendrán las ponderaciones de la convocatoria extraordinaria en modo presencial.

Evaluación única final

Dada la metodología de evaluación considerada, no es necesario ningún cambio. Si no fuera posible evaluar de forma presencial, se realizaría un examen multi-pregunta a distancia para la parte teórica de la asignatura y una prueba práctica, también telemática, para la parte práctica.

ESCENARIO B (SUSPENSIÓN DE LA ACTIVIDAD PRESENCIAL)

Horario (Según lo establecido en el POD)

El horario de tutorías se podrá consultar en el siguiente enlace

https://decsai.ugr.es/index.php/docencia/profesorado

así como en el directorio de la UGR

https://directorio.ugr.es

Herramientas para la atención tutorial (Indicar medios telemáticos para la atención tutorial)

La atención tutorial se realizará online mediante las plataformas y herramientas que recomiende la Universidad de Granada.

Medidas de adaptación de la evaluación (Instrumentos, criterios y porcentajes sobre la calificación)

El profesorado de la asignatura adaptará, total o parcialmente, los contenidos para su impartición online en los horarios establecidos por el centro.

Se utilizarán las plataformas y herramientas proporcionadas por la Universidad de Granada.

  • Todas las clases serían virtuales. Se impartirían utilizando la plataforma Google Meet o las que dictara la UGR en su momento. Se primaría la impartición síncrona, aunque las circunstancias sanitarias (enfermedad del profesor o familiar, conciliación familiar, …) podrían imponer un escenario asíncrono, en cuyo caso se grabarían las clases presenciales, que serían compartidas por Google Drive y se complementarían con actuaciones de seguimiento y retorno formativo específicas para ese fin (tutorías, tareas, entregas, …).
  • Se proporcionaría al estudiantado vídeos de apoyo de los temas impartidos de forma no presencial. En la mayoría de los casos serían vídeos resumidos, diseñados expresamente, con los contenidos más importantes del tema y soportados también con presentaciones por transparencias en el propio vídeo. En algunos casos, serían grabaciones directas de las clases impartidas por videoconferencia.
  • El temario práctico no requeriría de ninguna adaptación ya que se usan herramientas de software libre, que el estudiantado tiene disponibles, para su realización.
  • Teniendo en cuenta la tipología de las sesiones prácticas, se impartirían y desarrollarían de forma virtual sin problema. Si fuera necesario, se aplicaría una metodología de clase invertida en la que el profesor pondría a disposición del estudiantado y antes de la celebración de la clase síncrona una serie de vídeos de una duración razonable con los conocimientos más importantes. En ese caso, los estudiantes visualizarían los vídeos con antelación y se utilizaría la clase síncrona para aclarar dudas y discutir sobre los conceptos.

Evaluación ordinaria

Dada la metodología de evaluación considerada, no es necesario ningún cambio. Se realizaría un examen multi-pregunta a distancia para la parte teórica y una defensa telemática de la parte práctica, manteniendo las ponderaciones de la convocatoria ordinaria en modo presencial.

Evaluación extraordinaria

Dada la metodología de evaluación considerada, no es necesario ningún cambio. Se realizaría un examen multi-pregunta a distancia para la parte teórica y una prueba práctica telemática para aquellos estudiantes que tengan/quieran mejorar la calificación obtenida en prácticas en la convocatoria ordinaria. Se mantienen las ponderaciones de la convocatoria ordinaria en modo presencial.

Evaluación única final

Dada la metodología de evaluación considerada, no es necesario ningún cambio. Se realizaría un examen multi-pregunta a distancia para la parte teórica y una prueba práctica telemática manteniendo las ponderaciones de la convocatoria ordinaria en modo presencial.