Guía docente de Tratamiento Inteligente de Datos (M50/56/2/3)

Curso 2022/2023
Fecha de aprobación por la Comisión Académica 12/07/2022

Máster

Máster Universitario en Ingeniería Informática

Módulo

Tecnologías Informáticas 1

Rama

Ingeniería y Arquitectura

Centro en el que se imparte la docencia

E.T.S. de Ingenierías Informática y de Telecomunicación

Centro Responsable del título

Escuela Internacional de Posgrado

Semestre

Primero

Créditos

4

Tipo

Obligatorio

Tipo de enseñanza

Presencial

Profesorado

  • Gabriel Navarro Garulo

Horario de Tutorías

Gabriel Navarro Garulo

Email
No hay tutorías asignadas para el curso académico.

Breve descripción de contenidos (Según memoria de verificación del Máster)

Fundamentos de Estadística para Data Mining, Modelos de Aprendizaje, Procesamiento y Reducción de Datos, Imprecisión e Incertidumbre en Minería de Datos, Agrupamiento (clustering), Técnicas de Clasificación, Asociaciones de atributos, reglas de asociación y dependencias funcionales, Aplicaciones relevantes: análisis de soluciones y problemas abiertos, Nuevas tendencias en Minería de Datos.

Prerrequisitos y/o Recomendaciones

Tener  superadas todas las asignaturas del grado de Ingeniería Informática o conocimientos equivalentes.

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias Generales

  • G01. Capacidad para proyectar, calcular y diseñar productos, procesos e instalaciones en todos los ámbitos de la ingeniería informática. 
  • G04. Capacidad para el modelado matemático, cálculo y simulación en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación, desarrollo e innovación en todos los ámbitos relacionados con la Ingeniería en Informática. 

Competencias Específicas

  • CE04. Capacidad para modelar, diseñar, definir la arquitectura, implantar, gestionar, operar, administrar y mantener aplicaciones, redes, sistemas, servicios y contenidos informáticos. 
  • CE08. Capacidad para analizar las necesidades de información que se plantean en un entorno y llevar a cabo en todas sus etapas el proceso de construcción de un sistema de información. 
  • CE10. Capacidad para comprender y poder aplicar conocimientos avanzados de computación de altas prestaciones y métodos numéricos o computacionales a problemas de ingeniería. 
  • CE12. Capacidad para aplicar métodos matemáticos, estadísticos y de inteligencia artificial para modelar, diseñar y desarrollar aplicaciones, servicios, sistemas inteligentes y sistemas basados en el conocimiento. 

Competencias Transversales

  • CT01. Capacidad de análisis y síntesis: Encontrar, analizar, criticar (razonamiento crítico), relacionar, estructurar y sintetizar información proveniente de diversas fuentes, así como integrar ideas y conocimientos 
  • CT02. Capacidad de organización y planificación así como capacidad de gestión de la información. 
  • CT03. Capacidad para el uso y aplicación de las TIC en el ámbito académico y profesional. 
  • CT06. Capacidad para innovar y generar nuevas ideas 

Resultados de aprendizaje (Objetivos)

  • Analizar y categorizar adecuadamente algoritmos y modelos de aprendizaje existentes. Adquirir el bagaje suficiente para proponer métodos alternativos adecuados a situaciones específicas no descritas anteriormente.
  • Aplicar los métodos básicos para la limpieza de datos necesaria, previa a cualquier análisis estadístico o destinado al aprendizaje automático.
  • Conocer los desarrollos más importantes de Minería de Datos.
  • Conocer las nuevas tendencias en Minería de Datos

Programa de contenidos Teóricos y Prácticos

Teórico

  • Tema 1Introducción al Tratamiento Inteligentes de Datos (IDA). Motivación histórica. IDA, KDD y Minería de Datos. Fases de KDD. Aplicaciones.
  • Tema 2. Preparación de Datos. Tipos de datos. Limpieza y visualización. Transformación. Reducción.
  • Tema 3. Clasificación.  Introducción. Fases del problema de clasificación. Métodos Bayesianos. Método del vecino más cercano. Árboles de decisión. Clasificación con reglas. Problemas de clasificación basados en Lógica Difusa. Validación de resultados
  • Tema 4. Agrupamiento (Clustering). Introducción. Tipos de datos y distancias. Clustering jerárquico. Clustering basado en representantes. Clustering basado en densidad. Otros modelos de agrupamiento. Validación de agrupamientos.
  • Tema 5. Regresión. Introducción. Relaciones funcionales entre atributos. Análisis de regresión: ideas básicas. La regresión lineal. La regresión multivariante. La regresión logística.
  • Tema 6. Asociación de atributos. Reglas de asociación: definición, mecanismos de cálculo. Medidas de bondad de las reglas de regresión. Introducción a las reglas de asociación difusas.
  • Tema 7. Series Temporales. Concepto de serie temporal. Modelos clásicos. Modelos AR.
  • Tema 8. Minería de textos. Introducción de la Minería de Textos. Preprocesamiento de datos textuales. Análisis de semántica latente. Clustering y asociación  en Minería de Textos. Problemas especiales en Minería de Textos: detección de entidades, detección de sucesos.

Práctico

Seminarios/Talleres:

  • Introducción a las herramientas de Minería de Datos.
  • Presentación de casos prácticos de IDA por parte de grupos de alumnos.

Prácticas de Laboratorio:

  • Práctica 1. Resolución de casos de preprocesamiento de datos 
  • Práctica 2. Resolución de casos de agrupamiento de datos 
  • Practica 3. Resolución casos de clasificación 
  • Práctica 4. Resolución de casos de asociación 
  • Práctica 5. Resolución de casos de minería de textos 
  • Practica 6. Resolución de casos de series temporales  

Bibliografía

Bibliografía fundamental

  • J. H. Orallo, M. J. Ramírez Quintana and C. Ferri Ramírez, Introducción a la Minería de Datos, Pearson, 2004.
  • P-N. Tan, M. Steinbach, A. Karpatne and V. Kumar, Introduction to Data Mining, 2nd Edition, Addison Wesley, 2019.
  • C. Aggarwal, Data Mining: The textbook, Springer, 2015.
  • G. Bakos, KNIME Essential, PACK, 2015.
  • W. N. Venables, D.M. Smith and the R development core team, An introduction to R, 2nd Edition, Network Theory Ltd., 2009. 
  • Y. Zhao, R and Data Mining: Examples and Case Studies, Academic Press, 2012.

Bibliografía complementaria

  • M. J. Zaki and W. Meira Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2014.
  • F. Provost and T. Fawcett, Data Science for Business, O’Reilly,  2013.

Enlaces recomendados

  • www.kaggle.com
  • www.kdnuggets.com

Metodología docente

  • MD01 Clases Teóricas-Expositivas 
  • MD02 Resolución de Problemas 
  • MD03 Resolución de Casos Prácticos 
  • MD04 Aprendizaje basado en Proyectos 
  • MD05 Prácticas en Laboratorio 
  • MD09 Demos 
  • MD10 Exposición de Trabajos Tutelados 
  • MD11 Conferencias 
  • MD16 Tutorías Académicas 

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

Se utilizarán alguna o algunas de las siguientes técnicas de evaluación:

  • Para la parte teórica, se realizarán pruebas y exámenes de los contenidos impartidos en teoría, y los alumnos deberán entregar y presentar trabajos (individuales o en grupo) relacionados con los contenidos de la asignatura. Para estos últimos, se valorarán las entregas de los informes/memorias realizados por los alumnos y la presentación oral de los trabajos desarrollados.
  • Para la parte práctica, se realizarán prácticas de laboratorio, resolución de problemas y desarrollo de proyectos (individuales o en grupo), y se valorarán las entregas de los informes/memorias realizados por los alumnos y la presentación oral de los trabajos desarrollados o, en su caso, las entrevistas personales con los alumnos. Se podrá tener en cuenta la asistencia a los seminarios.

La calificación global corresponderá a la puntuación ponderada de los diferentes aspectos y actividades que integran el sistema de evaluación. Por tanto, el resultado de la evaluación será una calificación numérica obtenida mediante la suma ponderada de las calificaciones correspondientes a una parte teórica y una parte práctica. El peso de la evaluación de cada actividad formativa, se ajustará a lo siguiente:

Parte Teórica: Exámenes, sesiones de evaluación, entregas de actividades y trabajos, discusión de resultados, presentación de trabajos. 50% de la calificación final.

Parte Práctica: Entrega de ejercicios de prácticas, desarrollo de casos prácticos, presentación de casos prácticos, discusión de resultados. 50% de la calificación final.

Para aprobar la asignatura es necesario tener una calificación numérica superior o igual a 5 (sobre 10). No obstante, además del requisito anterior, se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5,  al no haber superado la asignatura la calificación final será de 4.

El sistema de calificaciones se expresará mediante calificación numérica de acuerdo con lo establecido en el art. 5 del R. D 1125/2003, de 5 de septiembre, por el que se establece el sistema europeo de créditos y el sistema de calificaciones en las titulaciones universitarias de carácter oficial y validez en el territorio nacional.

Evaluación Extraordinaria

La evaluación en la convocatoria extraordinaria consistirá en un examen de teoría y la presentación de un trabajo práctico donde se ponga de manifiesto que se han alcanzado todos los resultados de aprendizaje que se expresan como objetivos en la descripción de la asignatura. El trabajo de la parte práctica deberá ser defendido en una entrevista con el profesor. La ponderación entre las partes teórica y práctica será de 50% la parte teórica y 50% la parte práctica. Se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5 al no haber superado la asignatura, la calificación final será de 4.

Evaluación única final

La evaluación única final consistirá en un examen de teoría y la presentación de un trabajo práctico donde se ponga de manifiesto que se han alcanzado todos los resultados de aprendizaje que se expresan como objetivos en la descripción de la asignatura. El trabajo de la parte práctica deberá ser defendido en una entrevista con el profesor. La ponderación entre las partes teórica y práctica será de 50% la parte teórica y 50% la parte práctica. Se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5 al no haber superado la asignatura, la calificación final será de 4.

Información adicional