Guía docente de Tratamiento Inteligente de Datos (M50/56/2/3)
Máster
Módulo
Rama
Centro en el que se imparte la docencia
Centro Responsable del título
Semestre
Créditos
Tipo
Tipo de enseñanza
Profesorado
- Gabriel Navarro Garulo
Breve descripción de contenidos (Según memoria de verificación del Máster)
Fundamentos de Estadística para Data Mining, Modelos de Aprendizaje, Procesamiento y Reducción de Datos, Imprecisión e Incertidumbre en Minería de Datos, Agrupamiento (clustering), Técnicas de Clasificación, Asociaciones de atributos, reglas de asociación y dependencias funcionales, Aplicaciones relevantes: análisis de soluciones y problemas abiertos, Nuevas tendencias en Minería de Datos.
Prerrequisitos y/o Recomendaciones
Tener superadas todas las asignaturas del grado de Ingeniería Informática o conocimientos equivalentes.
Competencias
Competencias Básicas
- CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
- CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
- CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
- CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
- CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
Competencias Generales
- G01. Capacidad para proyectar, calcular y diseñar productos, procesos e instalaciones en todos los ámbitos de la ingeniería informática.
- G04. Capacidad para el modelado matemático, cálculo y simulación en centros tecnológicos y de ingeniería de empresa, particularmente en tareas de investigación, desarrollo e innovación en todos los ámbitos relacionados con la Ingeniería en Informática.
Competencias Específicas
- CE04. Capacidad para modelar, diseñar, definir la arquitectura, implantar, gestionar, operar, administrar y mantener aplicaciones, redes, sistemas, servicios y contenidos informáticos.
- CE08. Capacidad para analizar las necesidades de información que se plantean en un entorno y llevar a cabo en todas sus etapas el proceso de construcción de un sistema de información.
- CE10. Capacidad para comprender y poder aplicar conocimientos avanzados de computación de altas prestaciones y métodos numéricos o computacionales a problemas de ingeniería.
- CE12. Capacidad para aplicar métodos matemáticos, estadísticos y de inteligencia artificial para modelar, diseñar y desarrollar aplicaciones, servicios, sistemas inteligentes y sistemas basados en el conocimiento.
Competencias Transversales
- CT01. Capacidad de análisis y síntesis: Encontrar, analizar, criticar (razonamiento crítico), relacionar, estructurar y sintetizar información proveniente de diversas fuentes, así como integrar ideas y conocimientos
- CT02. Capacidad de organización y planificación así como capacidad de gestión de la información.
- CT03. Capacidad para el uso y aplicación de las TIC en el ámbito académico y profesional.
- CT06. Capacidad para innovar y generar nuevas ideas
Resultados de aprendizaje (Objetivos)
- Analizar y categorizar adecuadamente algoritmos y modelos de aprendizaje existentes. Adquirir el bagaje suficiente para proponer métodos alternativos adecuados a situaciones específicas no descritas anteriormente.
- Aplicar los métodos básicos para la limpieza de datos necesaria, previa a cualquier análisis estadístico o destinado al aprendizaje automático.
- Conocer los desarrollos más importantes de Minería de Datos.
- Conocer las nuevas tendencias en Minería de Datos
Programa de contenidos Teóricos y Prácticos
Teórico
- Tema 1. Introducción al Tratamiento Inteligentes de Datos (IDA). Motivación histórica. IDA, KDD y Minería de Datos. Fases de KDD. Aplicaciones.
- Tema 2. Preparación de Datos. Tipos de datos. Limpieza y visualización. Transformación. Reducción.
- Tema 3. Clasificación. Introducción. Fases del problema de clasificación. Métodos Bayesianos. Método del vecino más cercano. Árboles de decisión. Clasificación con reglas. Problemas de clasificación basados en Lógica Difusa. Validación de resultados
- Tema 4. Agrupamiento (Clustering). Introducción. Tipos de datos y distancias. Clustering jerárquico. Clustering basado en representantes. Clustering basado en densidad. Otros modelos de agrupamiento. Validación de agrupamientos.
- Tema 5. Regresión. Introducción. Relaciones funcionales entre atributos. Análisis de regresión: ideas básicas. La regresión lineal. La regresión multivariante. La regresión logística.
- Tema 6. Asociación de atributos. Reglas de asociación: definición, mecanismos de cálculo. Medidas de bondad de las reglas de regresión. Introducción a las reglas de asociación difusas.
- Tema 7. Series Temporales. Concepto de serie temporal. Modelos clásicos. Modelos AR.
- Tema 8. Minería de textos. Introducción de la Minería de Textos. Preprocesamiento de datos textuales. Análisis de semántica latente. Clustering y asociación en Minería de Textos. Problemas especiales en Minería de Textos: detección de entidades, detección de sucesos.
Práctico
Seminarios/Talleres:
- Introducción a las herramientas de Minería de Datos.
- Presentación de casos prácticos de IDA por parte de grupos de alumnos.
Prácticas de Laboratorio:
- Práctica 1. Resolución de casos de preprocesamiento de datos
- Práctica 2. Resolución de casos de agrupamiento de datos
- Practica 3. Resolución casos de clasificación
- Práctica 4. Resolución de casos de asociación
- Práctica 5. Resolución de casos de minería de textos
- Practica 6. Resolución de casos de series temporales
Bibliografía
Bibliografía fundamental
- J. H. Orallo, M. J. Ramírez Quintana and C. Ferri Ramírez, Introducción a la Minería de Datos, Pearson, 2004.
- P-N. Tan, M. Steinbach, A. Karpatne and V. Kumar, Introduction to Data Mining, 2nd Edition, Addison Wesley, 2019.
- C. Aggarwal, Data Mining: The textbook, Springer, 2015.
- G. Bakos, KNIME Essential, PACK, 2015.
- W. N. Venables, D.M. Smith and the R development core team, An introduction to R, 2nd Edition, Network Theory Ltd., 2009.
- Y. Zhao, R and Data Mining: Examples and Case Studies, Academic Press, 2012.
Bibliografía complementaria
- M. J. Zaki and W. Meira Jr., Data Mining and Analysis: Fundamental Concepts and Algorithms, Cambridge University Press, 2014.
- F. Provost and T. Fawcett, Data Science for Business, O’Reilly, 2013.
Enlaces recomendados
- www.kaggle.com
- www.kdnuggets.com
Metodología docente
- MD01 Clases Teóricas-Expositivas
- MD02 Resolución de Problemas
- MD03 Resolución de Casos Prácticos
- MD04 Aprendizaje basado en Proyectos
- MD05 Prácticas en Laboratorio
- MD09 Demos
- MD10 Exposición de Trabajos Tutelados
- MD11 Conferencias
- MD16 Tutorías Académicas
Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)
Evaluación Ordinaria
Se utilizarán alguna o algunas de las siguientes técnicas de evaluación:
- Para la parte teórica, se realizarán pruebas y exámenes de los contenidos impartidos en teoría, y los alumnos deberán entregar y presentar trabajos (individuales o en grupo) relacionados con los contenidos de la asignatura. Para estos últimos, se valorarán las entregas de los informes/memorias realizados por los alumnos y la presentación oral de los trabajos desarrollados.
- Para la parte práctica, se realizarán prácticas de laboratorio, resolución de problemas y desarrollo de proyectos (individuales o en grupo), y se valorarán las entregas de los informes/memorias realizados por los alumnos y la presentación oral de los trabajos desarrollados o, en su caso, las entrevistas personales con los alumnos. Se podrá tener en cuenta la asistencia a los seminarios.
La calificación global corresponderá a la puntuación ponderada de los diferentes aspectos y actividades que integran el sistema de evaluación. Por tanto, el resultado de la evaluación será una calificación numérica obtenida mediante la suma ponderada de las calificaciones correspondientes a una parte teórica y una parte práctica. El peso de la evaluación de cada actividad formativa, se ajustará a lo siguiente:
Parte Teórica: Exámenes, sesiones de evaluación, entregas de actividades y trabajos, discusión de resultados, presentación de trabajos. 50% de la calificación final.
Parte Práctica: Entrega de ejercicios de prácticas, desarrollo de casos prácticos, presentación de casos prácticos, discusión de resultados. 50% de la calificación final.
Para aprobar la asignatura es necesario tener una calificación numérica superior o igual a 5 (sobre 10). No obstante, además del requisito anterior, se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5, al no haber superado la asignatura la calificación final será de 4.
El sistema de calificaciones se expresará mediante calificación numérica de acuerdo con lo establecido en el art. 5 del R. D 1125/2003, de 5 de septiembre, por el que se establece el sistema europeo de créditos y el sistema de calificaciones en las titulaciones universitarias de carácter oficial y validez en el territorio nacional.
Evaluación Extraordinaria
La evaluación en la convocatoria extraordinaria consistirá en un examen de teoría y la presentación de un trabajo práctico donde se ponga de manifiesto que se han alcanzado todos los resultados de aprendizaje que se expresan como objetivos en la descripción de la asignatura. El trabajo de la parte práctica deberá ser defendido en una entrevista con el profesor. La ponderación entre las partes teórica y práctica será de 50% la parte teórica y 50% la parte práctica. Se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5 al no haber superado la asignatura, la calificación final será de 4.
Evaluación única final
La evaluación única final consistirá en un examen de teoría y la presentación de un trabajo práctico donde se ponga de manifiesto que se han alcanzado todos los resultados de aprendizaje que se expresan como objetivos en la descripción de la asignatura. El trabajo de la parte práctica deberá ser defendido en una entrevista con el profesor. La ponderación entre las partes teórica y práctica será de 50% la parte teórica y 50% la parte práctica. Se establece como requisito adicional para superar la asignatura que tanto la calificación correspondiente a la parte teórica como la correspondiente a la parte práctica sean mayores o iguales a 4 (sobre 10). Caso de que no se alcance el mínimo en alguna de las dos partes, aunque la media ponderada sea mayor que 5 al no haber superado la asignatura, la calificación final será de 4.