Guía docente de Minería de Datos: Aprendizaje No Supervisado y Detección de Anomalías (M51/56/3/7)

Curso 2022/2023
Fecha de aprobación por la Comisión Académica 05/07/2022

Máster

Máster Universitario en Ciencia de Datos e Ingeniería de Computadores

Módulo

Módulo de Nivelación de Conocimientos

Rama

Ingeniería y Arquitectura

Centro Responsable del título

International School for Postgraduate Studies

Semestre

Primero

Créditos

4

Tipo

Optativa

Tipo de enseñanza

Presencial

Profesorado

  • Jesús Alcalá Fernández
  • Juan Carlos Cubero Talavera
  • Daniel Sánchez Fernández
  • Isaac Triguero Velázquez

Tutorías

Jesús Alcalá Fernández

Email
  • Tutorías 1º semestre
    • Lunes 9:30 a 11:00 (M1 (F Ciencias))
    • Lunes 12:00 a 13:30 (M1 (F Ciencias))
    • Martes 16:00 a 17:00 (M1 (F Ciencias))
    • Viernes 10:00 a 11:00 (M1 (F Ciencias))
    • Viernes 12:00 a 13:00 (M1 (F Ciencias))
  • Tutorías 2º semestre
    • Lunes 10:00 a 13:00 (D16 Etsiit)
    • Lunes 10:00 a 13:00 (D20 Etsiit)
    • Jueves 10:00 a 13:00 (D16 Etsiit)
    • Jueves 10:00 a 13:00 (D20 Etsiit)

Juan Carlos Cubero Talavera

Email
  • Tutorías 1º semestre
    • Lunes 8:30 a 9:30 (D37 Etsiit)
    • Miércoles 8:30 a 9:30 (D37 Etsiit)
    • Miércoles 11:30 a 13:30 (D37 Etsiit)
    • Miercoles 8:30 a 9:30 (D37 Etsiit)
    • Miercoles 11:30 a 13:30 (D37 Etsiit)
    • Viernes 12:30 a 13:30 (D37 Etsiit)
    • Viernes 8:30 a 9:30 (D37 Etsiit)
  • Tutorías 2º semestre
    • Viernes 8:30 a 14:30 (D37 Etsiit)

Daniel Sánchez Fernández

Email
  • Tutorías 1º semestre
    • Miercoles 17:30 a 20:30 (D28 Etsiit)
    • Miércoles 17:30 a 20:30 (D28 Etsiit)
    • Jueves 17:30 a 20:30 (D28 Etsiit)
  • Tutorías 2º semestre
    • Martes 10:00 a 13:00 (D28 Etsiit)
    • Miercoles 10:00 a 13:00 (D28 Etsiit)
    • Miércoles 10:00 a 13:00 (D28 Etsiit)

Isaac Triguero Velázquez

Email
No hay tutorías asignadas para el curso académico.

Breve descripción de contenidos (Según memoria de verificación del Máster)

  1. Clustering:
    1. Métodos basados en centróides.
    2. Métodos jerárquicos.
    3. Métodos de evaluación: Interna y externa.
  2. Reglas de Asociación: 
    1. Métodos de generación.
    2. Conjuntos maximales y cerrados.
    3. Tratamiento de valores numéricos. Reglas Multinivel.
    4. Evaluación: Medidas de interés.
  3. Anomalías:
    1. Métodos Supervisados.
    2. Métodos Semi-supervisados.
    3. Métodos No supervisados

Prerrequisitos y/o Recomendaciones

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Resultados de aprendizaje (Objetivos)

El alumno aprenderá los algoritmos más importantes para realizar agrupamientos no supervisados de conjuntos de datos utilizando los métodos basados en centroides y los basados en agrupaciones sucesivas (o jerárquicos). Aprenderá a evaluar la calidad de los agrupamientos obtenidos y aplicará los conocimientos obtenidos a casos prácticos en las aulas de laboratorio.

El alumno aprenderá los algoritmos principales para obtener patrones frecuentes y reglas de asociación, conocerá los problemas inherentes asociados al tipo de conocimiento extraído y los resolverá aplicando las distintas medidas de interés, así como utilizando patrones maximales y cerrados para condensar la información obtenida. Aprenderá a poner en práctico estos conocimientos en las aulas de laboratorio.

Programa de contenidos Teóricos y Prácticos

Teórico

  1. - Clustering:
    1. Métodos basados en centróides.
    2. Métodos jerárquicos.
    3. Métodos de evaluación: Interna y externa.
  2. - Reglas de Asociación:
    1. Métodos de generación.
    2. Conjuntos maximales y cerrados.
    3. Tratamiento de valores numéricos. Reglas Multinivel.
    4. Evaluación: Medidas de interés.
  3. - Anomalías:
    1. Métodos Supervisados.
    2. Métodos Semi-Supervisados.
    3. Métodos No Supervisados.

 

Práctico

Práctica 1: Clustering

Práctica 2: Reglas de Asociación

Práctica 3: Anomalías.

Bibliografía

Bibliografía fundamental

  • Pang-Ning TanMichael Steinbach , Vipin Kumar  Introduction to Data Mining Addison Wesley (2006)
  • Ian H. Witten Eibe Frank Data Mining Practical Machine Learning Tools and Techniques, Second Edition Elsevier (2005)
  • Michael R. Berthold, Christian Borgelt, Frank Höppner,  Frank Klawonn Guide to Intelligent Data Analysis Springer Verlag (2010)

Bibliografía complementaria

  • Foster Provost and Tom Fawcett Data Science for Business O’Reilly  (2013)

Enlaces recomendados

Metodología docente

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

Todo lo relativo a la evaluación se regirá por la normativa de evaluación y de calificación de los estudiantes de la Universidad de Granada. El sistema de calificaciones se expresará mediante calificación numérica de acuerdo con lo establecido en el art. 5 del R. D 1125/2003, de 5 de septiembre, por el que se establece el sistema europeo de créditos y el sistema de calificaciones en las titulaciones universitarias de carácter oficial y validez en el territorio nacional.

La metodología de evaluación se compone de los siguientes elementos:

  • SE1. Evaluación de la Parte Teórica: exámenes finales o parciales, sesiones de evaluación y entregas de ejercicios sobre el desarrollo y los resultados de las actividades propuestas. Ponderación 50%
  • SE2. Evaluación de la Parte Práctica: se realizarán prácticas de laboratorio, resolución de problemas y desarrollo de proyectos (individuales o en grupo), y se valorarán las entregas de los informes/memorias realizados por los alumnos, o en su caso las entrevistas personales con los alumnos y las sesiones de evaluación. Ponderación 50%

Más en concreto:

  • Examen escrito global de la asignatura. Se propone este examen debido a que se trata de una asignatura de nivelación y debe garantizarse que el alumno adquiere todos los conceptos básicos que serán necesarios en otras materias.
  • Un trabajo práctico a desarrollar por el alumno de aquella parte de la asignatura (clustering, anomalías, asociación) que el alumno elija. Dicho trabajo consistirá en desarrollar el guión de prácticas de la parte correspondiente con un dataset distinto al utilizado en clase, a elegir por el alumno. El  trabajo debe incluir un análisis descriptivo de los resultados obtenidos.
  • La ponderación será: 0,5 examen+0,5 trabajo práctico. Será necesario obtener una puntuación mayor a 3,5 sobre 10 en cada una de las partes para hacer la media. En caso de que no se llegue al mínimo en alguna de las partes, se le asignara al estudiante como calificación final el mínimo entre 4,9 y la nota obtenida en la asignatura.

Evaluación Extraordinaria

El artículo 19 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que los estudiantes que no hayan superado la asignatura en la convocatoria ordinaria dispondrán de una convocatoria extraordinaria. A ella podrán concurrir todos los estudiantes, con independencia de haber seguido o no un proceso de evaluación continua. De esta forma, el estudiante que no haya realizado la evaluación continua tendrá la posibilidad de obtener el 100% de la calificación mediante la realización de un examen de teoría y la entrega de un trabajo de prácticas.

La evaluación sigue el mismo esquema que el examen de la convocatoria ordinaria, salvo que, si el estudiante ya se hubiese presentado al examen escrito o entregado la práctica, se le mantiene la nota de la parte que el alumno decida (siempre que no se presente a esa parte en esta convocatoria extraordinaria)

Evaluación única final

El artículo 8 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que podrán acogerse a la evaluación única final, el estudiante que no pueda cumplir con el método de evaluación continua por causas justificadas. Para acogerse a la evaluación única final, el estudiante deberá solicitarlo al Coordinador del Máster dentro del plazo establecido.

En la evaluación única final, el 50% de la nota será un examen de teoría y el otro 50% de la nota se contabiliza mediante un examen práctico en las aulas de ordenadores, en el que el alumno deberá resolver varias cuestiones relacionadas con los guiones de prácticas de las tres partes de la asignatura. La ponderación será: 0,5 examen teoría+0,5 examen práctico. Será necesario obtener una puntuación mayor a 3,5 sobre 10 en cada una de las partes para hacer la media. En caso de que no se llegue al mínimo en alguna de las partes, se le asignara al estudiante como calificación final el mínimo entre 4,9 y la nota obtenida en la asignatura.

Información adicional