Guía docente de Series Temporales y Minería de Flujos de Datos (M51/56/3/21)

Curso 2024/2025
Fecha de aprobación por la Comisión Académica 19/07/2024

Máster

Máster Universitario en Ciencia de Datos e Ingeniería de Computadores

Módulo

Módulo de Modelos Avanzados de Ciencias de Datos

Rama

Ingeniería y Arquitectura

Centro Responsable del título

Escuela Internacional de Posgrado

Semestre

Segundo

Créditos

3

Tipo

Optativa

Tipo de enseñanza

Presencial

Profesorado

  • José Manuel Benítez Sánchez
  • Jorge Casillas Barranquero
  • Manuel Pegalajar Cuéllar

Horario de Tutorías

José Manuel Benítez Sánchez

Email
Tutorías 2º semestre
  • Martes 17:00 a 19:00 (D31 (Etsiit))
  • Jueves 17:30 a 18:30 (D31 (Etsiit))
  • Jueves 10:30 a 13:30 (D31 (Etsiit))

Jorge Casillas Barranquero

Email
  • Tutorías 1º semestre
    • Martes 13:30 a 15:00 (Mect (Fciencia))
    • Martes 10:00 a 11:30 (Mect (Fciencia))
    • Jueves 11:00 a 14:00 (D26 (Etsiit))
  • Tutorías 2º semestre
    • Martes 10:00 a 14:00 (D26 (Etsiit))

Manuel Pegalajar Cuéllar

Email
  • Tutorías 1º semestre
    • Lunes 15:30 a 17:30 (D19 (Etsiit))
    • Lunes 11:30 a 13:30 (D19 (Etsiit))
    • Martes 11:30 a 13:30 (D19 (Etsiit))
  • Tutorías 2º semestre
    • Lunes 10:30 a 12:30 (D19 (Etsiit))
    • Lunes 15:30 a 17:30 (D19 (Etsiit))
    • Martes 10:30 a 12:30 (D19 (Etsiit))

Breve descripción de contenidos (Según memoria de verificación del Máster)

Series temporales

  • Conceptos básicos
  • Análisis exploratorio de datos
  • Descomposición
  • Modelos ARIMA
  • Evaluación y diagnóstico de modelos de predicción
  • Técnicas avanzadas de predicción
  • Clasificación y clustering de series temporales

Minería de flujos de datos (data stream mining)

  • Definición y conceptos básicos, Ejemplos de aplicación
  • Métodos básicos (mantenimiento de estadísticas, sinopsis, ventana deslizante, ...)
  • Clasificación en flujos de datos. Métodos de evaluación y experimentación
  • Agrupamiento a partir de flujos de datos. Métodos de evaluación y experimentacion
  • Patrones frecuentes en flujos de datos. Métodos de evaluación y experimentación
  • Nuevas tendencias y líneas futuras
  • Software y repositorios de datos

 

Prerrequisitos y/o Recomendaciones

  • Conocimientos de los lenguajes de programación R y Python.
  • Conocimientos de conceptos y técnicas de Aprendizaje Automático.

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias Generales

  • CG01. Capacidad de acceso y gestión de la información 
  • CG02. Capacidad de análisis y síntesis 
  • CG03. Capacidad de organización y planificación 
  • CG04. Capacidad emprendedora 
  • CG05. Capacidad para tomar decisiones de forma autónoma 
  • CG06. Capacidad de uso de una lengua extranjera 
  • CG07. Motivación por la calidad 
  • CG08. Capacidad para trabajar en equipo 

Competencias Específicas

  • CE05. Capacidad para modelar y resolver problemas reales o académicos mediante técnicas de ciencia de datos 
  • CE07. Capacidad de utilización de herramientas avanzadas para modelar y resolver problemas en los que se dispone de un tamaño enorme de datos. 
  • CE08. Conocer algunas de las principales aplicaciones de la ciencia de datos y de las tecnologías inteligentes 

Competencias Transversales

  • CT01. Ser consciente de la importancia del desarrollo sostenible y demostrar sensibilidad medioambiental. 
  • CT02. Ser consciente del derecho a la no discriminación y al acceso universal al conocimiento de las personas con discapacidad. 

Resultados de aprendizaje (Objetivos)

  • Aprender el concepto de predicción y de serie temporal
  • Aprender a realizar la descomposición de una serie temporal
  • Aprender el procedimiento estadístico básico para el análisis de una serie temporal Aprender a construir modelos ARIMA
  • Aprender a evaluar modelos de predicción
  • Aprender a analizar y modelar series temporales con R y Python
  • Aprender el concepto de flujo de datos
  • Aprender las similitudes y diferencias entre series temporales y flujo de datos
  • Conocer aplicaciones y problemas reales de flujos de datos
  • Aprender los métodos básicos de flujos de datos
  • Aprender los principales modelos de clasificación a partir de flujos de datos
  • Aprender los principales modelos de agrupamiento en flujos de datos
  • Aprender los principales modelos de obtención de patrones frecuentes en flujos de datos Aprender métodos de evaluación y experimentación en flujos de datos
  • Aprender a usar software para flujos de datos

Programa de contenidos Teóricos y Prácticos

Teórico

Series temporales

  • Conceptos básicos
  • Análisis exploratorio de datos
  • Descomposición
  • Modelos basados en regresión
  • Modelos ARIMA
  • Evaluación y diagnóstico de modelos de predicción
  • Técnicas avanzadas de predicción
  • Minería de series temporales

Minería de flujos de datos (data stream mining)

  • Definición y conceptos básicos, Ejemplos de aplicación
  • Métodos básicos (mantenimiento de estadísticas, sinopsis, ventana deslizante, ...)
  • Clasificación en flujos de datos. Métodos de evaluación y experimentación
  • Agrupamiento a partir de flujos de datos. Métodos de evaluación y experimentacion
  • Patrones frecuentes en flujos de datos. Métodos de evaluación y experimentación
  • Nuevas tendencias y líneas futuras
  • Software y repositorios de datos

Práctico

Series temporales:

  • Análisis de series temporales
  • Predicción de series temporales
  • Diagnóstico de modelos de predicción

Minería de flujos de datos:

  • Construcción de clasificadores de flujos de datos
  • Aplicación de procedimientos de agrupamiento a flujos de datos
  • Aplicación de métodos de identificación de patrones frecuentes en flujos de datos

Bibliografía

Bibliografía fundamental

  • R. Hyndman, G. Athanasopoulus, «Forecasting: principles and practice» 2021, 3rd Edition, www.otexts.org/fpp3
  • R.H. Shumway, D.S. Stoffer, «Time Series Analysis and Its Applications», Springer, 2nd Ed., 2006
  • João Gama, Knowledge Discovery from Data Streams, Chapman and Hall/CRC, 2010
  • Albert Bifet, Ricard Gavaldà, Geoff Holmes, Bernhard Pfahringer, Machine Learning for Data Streams, The MIT Press, 2018

Bibliografía complementaria

  • Albert Bifet, Geoff Holmes, Richard Kirkby, Bernhard Pfahringer, Data Stream Mining – A Practical Approach, Centre for Open Software Innovation, 2011
  • C. Chatfield, "The analysis of time series: An Introduction", CRC Press, 2003.
  • J.D. Cryer, K.-S. Chan, "Time Series Analysis: With Applications in R", Springer, 2010
  • J. Gama, I. Žliobaitė, A. Bifet, M. Pechenizkiy, A survey on concept drift adaptation, ACM Computing Surveys 46:4 (2014) 44. DOI: 10.1145/2523813
  • B. Krawczyk, L.L. Minku, J. Gama, J. Stefanowski, M. Wozniak, Ensemble learning for data stream analysis: A survey, Information Fusion 37 (2017) 132-156. DOI: 10.1016/j.inffus.2017.02.004
  • T. Mitsa, "Temporal Data Mining", CRC Press, 2010.
  • D. Peña, "Análisis de series temporales", Alianza Editorial, 2010.
  • Moamar Sayed-Mouchaweh, Edwin Lughofer (Eds.), Learning in Non-Stationary Environments: Methods and Applications, Springer, 2012
  • J.A. Silva, E.R. Faria, R.C. Barros, E.R. Hruschka, A. De Carvalho, J. Gama, Data stream clustering: a survey, ACM Computing Surveys 46:1 (2013) 13. DOI: 10.1145/2522968.2522981

Metodología docente

  • MD01 Lección magistral/expositiva 
  • MD02 Resolución de problemas y estudio de casos prácticos 
  • MD03 Prácticas de laboratorio 
  • MD04 Seminarios 
  • MD05 Análisis de fuentes y documentos 
  • MD06 Realización de trabajos en grupo 
  • MD07 Realización de trabajos individuales 

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

Para su evaluación, los alumnos pueden optar por evaluación continua o evaluación única final.

La asignatura se compone de dos partes bien diferenciadas que la integran al 50% (series temporales y minería de flujos de datos). A cada una de las partes se dedica la mitad del tiempo y también aportan la mitad de la calificación de la asignatura.

En el caso de evaluación continua, los alumnos realizarán las siguientes actividades:

  • Parte "Series Temporales": 
    • Teoría: Examen escrito o cuestionario con múltiples preguntas y diversas posibles respuestas (25% de la calificación final).
    • Práctica: Resolver distintos problemas propuestos aplicando las técnicas aprendidas y redactar un informe explicando cómo han resuelto los problemas planteados (memoria de prácticas, 25% de la calificación final).
  • Parte "Minería de flujos de datos": Los alumnos entregarán un documento que incluirá una justificación teórica del método o métodos aplicados, decisiones tomadas, y aplicación práctica del mismo a los casos concretos suministrados.
    • Teoría: Memoría escrita respondiendo a diferentes preguntas sobre la parte teórica (25% de la calificación final).
    • Prácticas: Memoria de prácticas para resolución de ejercicios propuestos (25% de la calificación final)

La ponderación de estos elementos en la calificación final se indica en la siguiente tabla:

Actividades formativas Ponderación
Parte Teórica 50%
Parte Práctica 50%

No será imprescindible la asistencia a clase, aunque los alumnos que no lo hagan lo tendrán más difícil para preparar los documentos que se piden. La resolución de los problemas es eminentemente práctica.

Evaluación Extraordinaria

La evaluación en la convocatoria extraordinaria se realizará en un solo acto académico. Dicha prueba (evaluada de 0 a 10) incluirá pruebas tanto de tipo teórico como práctico que garanticen que el alumno ha adquirido la totalidad de las competencias descritas en esta guía docente. La parte práctica podrá ser sustituida por las calificaciones obtenidas en las memorias de prácticas (50% de la calificación), renunciando a la evaluación práctica en el examen.

 

Evaluación única final

Alternativamente a la evaluación continua, el alumno puede optar por la evaluación única final según lo dispuesto en la normativa de evaluación y de calificación de los estudiantes de la Universidad de Granada (http://secretariageneral.ugr.es/pages/normativa/ugr/ncg7121). Para acogerse a la evaluación única final, el estudiante, en las dos primeras semanas de impartición de la asignatura, lo solicitará al Coordinador del Máster, quienes darán traslado al profesorado correspondiente, alegando y acreditando las razones que le asisten para no poder seguir el sistema de evaluación continua.

La evaluación única final se realizará en un solo acto académico. Dicha prueba (evaluada de 0 a 10) incluirá pruebas tanto de tipo teórico como práctico que garanticen que el alumno ha adquirido la totalidad de las competencias descritas en esta guía docente.

Información adicional

Información de interés para estudiantado con discapacidad y/o Necesidades Específicas de Apoyo Educativo (NEAE): Gestión de servicios y apoyos (https://ve.ugr.es/servicios/atencion-social/estudiantes-con-discapacidad).

Software Libre

Python

R