Guía docente de Minería de Datos: Aspectos Avanzados (M51/56/3/23)

Curso 2022/2023
Fecha de aprobación por la Comisión Académica 05/07/2022

Máster

Máster Universitario en Ciencia de Datos e Ingeniería de Computadores

Módulo

Módulo de Modelos Avanzados de Ciencias de Datos

Rama

Ingeniería y Arquitectura

Centro Responsable del título

Escuela Internacional de Posgrado

Semestre

Segundo

Créditos

3

Tipo

Optativa

Tipo de enseñanza

Presencial

Profesorado

  • Alberto Luis Fernández Hilario
  • Salvador García López
  • Siham Tabik Ouled Hrour

Horario de Tutorías

Alberto Luis Fernández Hilario

Email
  • Tutorías 1º semestre
    • Martes 12:00 a 14:00 (Mect (F Ciencias))
    • Miércoles 11:00 a 13:00 (Mect (F Ciencias))
    • Jueves 11:00 a 13:00 (Mect (F Ciencias))
  • Tutorías 2º semestre
    • Miércoles 10:00 a 13:00 (D16 Etsiit)
    • Jueves 10:00 a 13:00 (D16 Etsiit)

Salvador García López

Email
  • Tutorías 1º semestre
    • Lunes 10:30 a 11:00 (Mect (F Cienicas))
    • Martes 11:00 a 12:00 (Mect (F Ciencias))
    • Miércoles 9:00 a 12:00 (Mect (F Cienicas))
  • Tutorías 2º semestre
    • Lunes 13:00 a 13:30 (D26 Etsiit)
    • Martes 9:00 a 12:00 (D26 Etsiit)

Siham Tabik Ouled Hrour

Email
  • Tutorías 1º semestre
    • Miércoles 11:00 a 13:00 (Nd Etsiit)
    • Viernes 9:00 a 11:00 (Nd Etsiit)
  • Tutorías 2º semestre
    • Miércoles 16:00 a 17:00 (Nd Etsiit)
    • Viernes 16:00 a 17:00 (Nd Etsiit)
    • Viernes 9:00 a 11:00 (Nd Etsiit)

Breve descripción de contenidos (Según memoria de verificación del Máster)

 Aspectos Avanzados en Clasificación:

  • Clasificación no balanceada
  • Clasificación ordinal y monótona
  • Multi-label classification
  • Multi-instance Learning
  • Clasificación de imágenes (p.e. utilizando arquitecturas de Deep Learning)

Aprendizaje no supervisado y semi-supervisado:

  • Extracción de características (p.e. mediante redes neuronales convolucionales)
  • Descubrimiento de Subgrupos
  • Aprendizaje Semi-Supervisado

Prerrequisitos y/o Recomendaciones

Se recomienda haber cursado la asignatura "Minería de Datos: Preprocesamiento y Clasificación".

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias Generales

  • CG01. Capacidad de acceso y gestión de la información 
  • CG02. Capacidad de análisis y síntesis 
  • CG03. Capacidad de organización y planificación 
  • CG04. Capacidad emprendedora 
  • CG05. Capacidad para tomar decisiones de forma autónoma 
  • CG06. Capacidad de uso de una lengua extranjera 
  • CG07. Motivación por la calidad 
  • CG08. Capacidad para trabajar en equipo 

Competencias Específicas

  • CE05. Capacidad para modelar y resolver problemas reales o académicos mediante técnicas de ciencia de datos 
  • CE07. Capacidad de utilización de herramientas avanzadas para modelar y resolver problemas en los que se dispone de un tamaño enorme de datos. 
  • CE08. Conocer algunas de las principales aplicaciones de la ciencia de datos y de las tecnologías inteligentes 

Competencias Transversales

  • CT01. Ser consciente de la importancia del desarrollo sostenible y demostrar sensibilidad medioambiental. 
  • CT02. Ser consciente del derecho a la no discriminación y al acceso universal al conocimiento de las personas con discapacidad. 

Resultados de aprendizaje (Objetivos)

El alumno aprenderá cómo resolver problemas complejos en minería de datos cuando los tipos de datos originales o el tipo de información a extraer requieren el uso de técnicas específicas para su resolución.

En concreto, aprenderán algoritmos y técnicas para la obtención de modelos de aprendizaje en los siguientes problemas:

  1. Aquéllos en que cada dato se puede corresponder con más de una clase;
  2. Cuando los valores de las clases no se encuentran uniformemente distribuidos en el conjunto de entrenamiento y hay un gran desequilibrio en cuanto a la frecuencia de aparición de algunas de ellas;
  3. Casos de estudio en que se debe tener en cuenta un orden establecido a priori en los valores de las clases;
  4. Datos que no son vectores de valores sino conjuntos de vectores que son etiquetados de forma global con un valor de clase, aunque localmente puedan tener otros valores de clase asignados distintos.
  5. Problemas de alta dimensionalidad, especialmente basados en imágenes y multimedia, por ejemplo, utilizando extracción de características y clasificación con arquitecturas basadas en redes neuronales artificiales profundas (Deep Learning).

Programa de contenidos Teóricos y Prácticos

Teórico

Aspectos Avanzados en Minería de Datos y Clasificación:

  • Clasificación no balanceada
  • Clasificación ordinal y monótona
  • Multi-label classification
  • Multi-instance learning
  • Descubrimiento de Subgrupos
  • Aprendizaje Semi-Supervisado

Aprendizaje Profundo (Deep Learning)

  • Fundamentos y operaciones básicas de las redes neuronales artificiales
  • Fundamentos y arquitecturas de las Redes Neuronales Convolucionales (CNNs)
  • Clasificación de imágenes

Práctico

Talleres de realización de ejercicios concretos en diferentes problemas estudiados:

  • Aprendizaje con clases no Balanceadas.
  • Aprendizaje Ordinal y con restricciones de monotonía.
  • Aprendizaje con Redes Neuronales Artificiales y con Redes Neuronales Convolucionales

Bibliografía

Bibliografía fundamental

Bibliografía complementaria

Enlaces recomendados

  • Página web del Máster Universitario Oficial en Ciencia de Datos e Ingeniería de Computadores: http://masteres.ugr.es/datcom.
  • Plataforma de Recursos de Apoyo a la Docencia - PRADO: https://prado.ugr.es
  • Departamento de Ciencias de la Computación e Inteligencia Artificial: https://decsai.ugr.es
  • Plataformas Kaggle (https://www.kaggle.com/) y DrivenData (https://www.drivendata.org/).

Metodología docente

  • MD01 Lección magistral/expositiva 
  • MD02 Resolución de problemas y estudio de casos prácticos 
  • MD03 Prácticas de laboratorio 
  • MD04 Seminarios 
  • MD05 Análisis de fuentes y documentos 
  • MD06 Realización de trabajos en grupo 
  • MD07 Realización de trabajos individuales 

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

El artículo 17 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que la convocatoria ordinaria estará basada preferentemente en la evaluación continua del estudiante, excepto para quienes se le haya reconocido el derecho a la evaluación única final.

La metodología de evaluación por defecto según la normativa de la Universidad de Granada es la evaluación continua, que en el caso de esta asignatura se compone de los siguientes elementos:

  • Evaluación de la Parte Teórica (50% sobre la nota final): exámenes finales o parciales, sesiones de evaluación y entregas de ejercicios sobre el desarrollo y los resultados de las actividades propuestas.
  • Evaluación de la Parte Práctica (30% sobre la nota final): se realizarán prácticas de laboratorio, resolución de problemas y desarrollo de proyectos (individuales o en grupo). Se valorarán las entregas de los informes/memorias realizados/as por los alumnos.
  • Evaluación de los Seminarios y otras actividades (20% sobre la nota final): se tendrá en cuenta la asistencia, los problemas propuestos que hayan sido resueltos y entregados por los alumnos y la presentación oral de los trabajos desarrollados.

La evaluación de la parte teórica, seminarios y otras actividades se realizará mediante la participación grupal (de tres a cinco estudiantes por grupo) en competiciones siguiendo el formato de Kaggle o DrivenData relacionadas con problemas avanzados que requieren aprendizaje profundo (un total del 70% de la nota final, donde el 20% se realiza sobre la presentación, entrega aparte, y el 50% restante sobre los aspectos del propio trabajo). La evaluación requerirá de una confección de una memoria, una presentación y defensa del trabajo realizado. La fecha de defensa se realizará en Abril, y se podrá emplear horas de dedicación docente de la asignatura no impartidas en el horario convencional que se trasladarán a la fecha concretada para que se pueda establecer un tiempo determinado y necesario para realizar el trabajo.

La evaluación de la parte práctica se realizará mediante la entrega de una actividad que comprenda algunas de las temáticas avanzadas de minería de datos y se establecerá un protocolo de corrección participativo entre el estudiantado y los profesores. Esta nota comprenderá el 30% sobre la nota final.

Evaluación Extraordinaria

El artículo 19 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que los estudiantes que no hayan superado la asignatura en la convocatoria ordinaria dispondrán de una convocatoria extraordinaria. A ella podrán concurrir todos los estudiantes, con independencia de haber seguido o no un proceso de evaluación continua. De esta forma, el estudiante que no haya realizado la evaluación continua tendrá la posibilidad de obtener el 100% de la calificación mediante la realización de una prueba y/o trabajo.

En las convocatorias extraordinarias se utilizará el mismo procedimiento de evaluación que en la evaluación única final, tal y como se describe en el siguiente apartado.

Evaluación única final

El artículo 8 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que podrán acogerse a la evaluación única final, el estudiante que no pueda cumplir con el método de evaluación continua por causas justificadas.

Para acogerse a la evaluación única final, el estudiante, en las dos primeras semanas de impartición de la asignatura o en las dos semanas siguientes a su matriculación si ésta se ha producido con posterioridad al inicio de las clases, lo solicitará, a través del procedimiento electrónico, a la Coordinación del Máster, quien dará traslado al profesorado correspondiente, alegando y acreditando las razones que le asisten para no poder seguir el sistema de evaluación continua.

La evaluación en tal caso consistirá en:

  • Evaluación de la Parte Teórica (70% de la calificación): exámenes finales o parciales, sesiones de evaluación y entregas de ejercicios sobre el desarrollo y los resultados de las actividades propuestas.
  • Evaluación de la Parte Práctica (30% de la calificación): se realizarán resolución de problemas y desarrollo de proyectos individuales. Se valorarán las entregas de los informes/memorias realizados por los estudiantes, así como su posible defensa.

La evaluación consistirá en realizar un trabajo teórico/práctico similar al que se hace en evaluación ordinaria, pero considerando un trabajo individual, autónomo, compensado y reducido por ello.

Información adicional