Guía docente de Minería de Datos (M42/56/1/42)

Curso 2022/2023
Fecha de aprobación por la Comisión Académica 13/07/2022

Máster

Máster Universitario en Estadística Aplicada

Módulo

Módulo I: Aplicaciones de la Estadística

Rama

Ciencias

Centro Responsable del título

Escuela Internacional de Posgrado

Semestre

Segundo

Créditos

4

Tipo

Optativa

Tipo de enseñanza

Enseñanza Virtual

Profesorado

  • Pedro María Carmona Sáez
  • Ana Esther Madrid García
  • Miguel Ángel Montero Alonso
  • Rocío Raya Miranda

Horario de Tutorías

Pedro María Carmona Sáez

Email
  • Tutorías 1º semestre
    • Martes 11:00 a 14:00 (Facultad de Medicina)
    • Miércoles 11:00 a 14:00 (Facultad de Medicina)
  • Tutorías 2º semestre
    • Jueves 8:00 a 14:00 (Facultad de Ciencias)

Ana Esther Madrid García

Email
  • Primer semestre
    • Martes 12:30 a 13:30 (Despacho 4.13 Facultad Deporte)
    • Jueves 12:30 a 14:00 (Despacho 4.13 Facultad Deporte)
    • Viernes 10:00 a 13:30 (Despacho 4.13 Facultad Deporte)
  • Segundo semestre
    • Lunes 13:00 a 14:00 (Despacho 15 F. Ciencias)
    • Lunes 10:00 a 11:00 (Despacho 15 F. Ciencias)
    • Miércoles 9:30 a 13:30 (Despacho 15 F. Ciencias)

Miguel Ángel Montero Alonso

Email
  • Primer semestre
    • Lunes 11:15 a 13:15 (Facu Medicina Desp. C8-05)
    • Jueves 11:15 a 13:15 (Facu Medicina Desp. C8-05)
    • Viernes 11:15 a 13:15 (Facu Medicina Desp. C8-05)
  • Segundo semestre
    • Miércoles 8:30 a 14:30 (Facu Medicina Desp. C8-05)

Rocío Raya Miranda

Email
  • Primer semestre
    • Lunes 9:00 a 13:00 (Despacho 27)
    • Miércoles 12:00 a 14:00 (Despacho 27)
  • Segundo semestre
    • Jueves 9:00 a 12:00 (Despacho 27)
    • Viernes 9:00 a 12:00 (Despacho 27)

Breve descripción de contenidos (Según memoria de verificación del Máster)

  • Introducción a la Minería de datos.
  • Técnicas de Minería de datos. Aplicaciones.
  • Técnicas de Minería de datos con Weka. Clasificadores.

Prerrequisitos y/o Recomendaciones

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias Generales

  • CG01. Los titulados han de saber aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio. 
  • CG02. Los titulados han de ser capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios. 
  • CG03. Los titulados han de saber comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades 
  • CG04. Los titulados deben poseer las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo. 
  • CG05. Los titulados han de demostrar una comprensión sistemática del campo de estudio y el dominio de las habilidades y métodos de investigación relacionados con dicho campo. 
  • CG06. Los titulados deben demostrar la capacidad de concebir, diseñar, poner en práctica y adoptar un proceso sustancial de investigación con seriedad académica. 
  • CG07. Los titulados han de realizar una contribución a través de una investigación original que amplíe las fronteras del conocimiento desarrollando un corpus sustancial, del que parte merezca la publicación referenciada a nivel nacional o internacional. 
  • CG08. Los titulados deben ser críticos en el análisis, evaluación y síntesis de ideas nuevas y complejas. 
  • CG09. Los titulados deben saber comunicarse con sus colegas, con la comunidad académica en su conjunto y con la sociedad en general acerca de sus áreas de conocimiento. 
  • CG10. Los titulados han de ser capaces de fomentar, en contextos académicos y profesionales, el avance tecnológico, social o cultural dentro de una sociedad basada en el conocimiento. 

Competencias Específicas

  • CE01. Conocer métodos para el Análisis de Datos 
  • CE02. Conocer diferentes técnicas de Muestreo 
  • CE03. Adquirir conocimientos avanzados en Probabilidad y Procesos Estocásticos 
  • CE04. Profundizar en las técnicas de Modelización Estocástica 
  • CE05. Adquirir conocimientos avanzados en Inferencia Estadística 
  • CE06. Aprender y entender técnicas de Estadística Multivariante 
  • CE07. Saber identificar y aplicar diferentes Modelos Econométricos 
  • CE09. Adquirir conocimientos en Bioestadística 
  • CE10. Dominar el uso de diferentes entornos de Computación Estadística 
  • CE11. Conocer y aplicar técnicas de Control Estadístico de Calidad 
  • CE12. Ser capaz de resolver problemas a través de técnicas de Simulación Estocástica 
  • CE13. Saber llevar a cabo el diseño, programación e implantación programas de computación estadística 
  • CE14. Saber realizar un diseño de experimentos 
  • CE15. Ser capaza de identificar la información relevante para resolver un problema 
  • CE16. Utilizar correcta y racionalmente programas de ordenador de tipo estadístico 
  • CE17. Adquirir capacidades de elaboración y construcción de modelos y su validación 
  • CE18. Ser capaz de realizar un análisis de datos 
  • CE19. Saber gestionar bases de datos 
  • CE20. Ser capaz de realizar una correcta representación gráfica de datos 
  • CE21. Conocer, identificar y seleccionar fuentes estadísticas 

Competencias Transversales

  • CT01. Mostrar interés por la calidad y la excelencia en la realización de diferentes tareas 
  • CT02. Comprender y defender la importancia que la diversidad de culturas y costumbres tienen en la investigación o práctica profesional 
  • CT03. Tener un compromiso ético y social en la aplicación de los conocimientos adquiridos 
  • CT04. Ser capaz de trabajar en equipos interdisciplinarios para alcanzar objetivos comunes desde campos expertos diferenciados. 
  • CT05. Incorporar los principios del Diseño Universal en el desempeño de su profesión 

Resultados de aprendizaje (Objetivos)

 El alumno sabrá/comprenderá:

- Las herramientas básicas utilizadas en Minería de datos.

- El modo en el que se extrae conocimiento.

- Utilizar software adecuado para la práctica de las herramientas básicas en Minería de Datos.

El alumno será capaz:

- Aplicar estas técnicas a casos concretos.

Programa de contenidos Teóricos y Prácticos

Teórico

  • Tema 1. Introducción a la Minería de datos

    • Introducción. Descubriendo conocimiento
    • El proceso de KDD
    • Los datos
    • Utilidad y aplicaciones de la Minería de datos
    • Retos y tendencias de la Minería de datos
  • Tema 2. Técnicas de Minería de datos

    • Introducción
    • La clasificación:
      1. Tablas de decisión
      2. Árboles de decisión
      3. Reglas de clasificación
      4. Clasificación bayesiana
      5. Aprendizaje basado en ejemplares
      6. Redes de neuronas
      7. Lógica borrosa (Fuzzy logic)
      8. Técnicas genéticas: algoritmos genéticos
  • Tema 3. Técnicas de Minería de datos en Weka

    • Introducción
    • Preparación de los datos
    • Ejecución de WEKA
    • Procesado de los datos
    • Visualización
    • Clasificación
    • Implementación de las técnicas de clasificación en WEKA

Bibliografía

Bibliografía fundamental

  • Bramer, M (2013), Principles of data mining, Springer
  • Hand, D., Mannola, H., Smyth, P. (2001) Principles of data minig. The MIT Press
  • Jiawei Han& Micheline Kamber (2006), Data Mining: Concepts and Techniques. Morgan Kaufmann.
  • Pang-NingTan, Michael Steinbach & Vipin Kumar (2006), Introduction to Data Mining. Addison-Wesley.

Bibliografía complementaria

  • Alpaydin, E. (2004). Introduction to Machine Learning. The MIT Press.
  • Data Mining and Knowledge Discovery (DMKD)

Enlaces recomendados

  • https://www.cs.waikato.ac.nz/ml/weka/
  • http://www.r-project.org
  • https://www.springer.com/journal/10618

Metodología docente

  • MD01 Lección magistral/expositiva 
  • MD02 Sesiones de discusión y debate 
  • MD03 Resolución de problemas y estudio de casos prácticos 
  • MD04 Prácticas de laboratorio o clínicas 
  • MD05 Seminarios 
  • MD06 Ejercicios de simulación 
  • MD07 Análisis de fuentes y documentos 
  • MD08 Realización de trabajos en grupo 
  • MD09 Realización de trabajos individuales 

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

El artículo 17 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que la convocatoria ordinaria estará basada preferentemente en la evaluación continua del estudiante, excepto para quienes se les haya reconocido el derecho a la evaluación única final.

 

La evaluación final del curso se hará atendiendo a los siguientes criterios:

  • Entrega de actividades propuestas, vía la plataforma Moodle, dentro de los plazos fijados:
    • Actividades sobre técnicas de Minería de datos (tema 2): clasificadores, diferentes algoritmos (50% de la calificación)
    • Actividades sobre técnicas de Minería de Datos en Weka (tema 3): clasificadores en Weka. (40% de la calificación)
  • Acceso a la plataforma y participación activa en los foros. (10% de la calificación)

 

Evaluación Extraordinaria

El artículo 19 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que los estudiantes que no hayan superado la asignatura en la convocatoria ordinaria dispondrán de una convocatoria extraordinaria. A ella podrán concurrir todos los estudiantes, con independencia de haber seguido o no un proceso de evaluación continua. De esta forma, el estudiante que no haya realizado la evaluación continua tendrá la posibilidad de obtener el 100% de la calificación mediante la realización de una prueba y/o trabajo que contemplará actividades sobre el tema 2 y/o tema 3
 

Realización de actividades que deberán ser entregadas en el periodo que se establezca en septiembre.

Evaluación única final

El artículo 8 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que podrán acogerse a la evaluación única final, el estudiante que no pueda cumplir con el método de evaluación continua por causas justificadas.

Para acogerse a la evaluación única final, el estudiante, en las dos primeras semanas de impartición de la asignatura o en las dos semanas siguientes a su matriculación si ésta se ha producido con posterioridad al inicio de las clases, lo solicitará, a través del procedimiento electrónico, a la Coordinación del Máster, quien dará traslado al profesorado correspondiente, alegando y acreditando las razones que le asisten para no poder seguir el sistema de evaluación continua.

La evaluación en tal caso consistirá en:

  • Examen teórico de los temas  incluidos en esta guía docente.
  • Examen práctico con WEKA.

Información adicional

El curso se desarrolla de modo virtual usando la plataforma Moodle.

Para una correcta planificación y desarrollo de los contenidos del curso, se proporciona al alumnado un calendario en el que se realiza una temporalización de los contenidos del curso, estructurados en temas.

El estudio de los contenidos del curso, por parte del alumnado, se apoya en los materiales disponibles en la plataforma y diseñados para un autoaprendizaje. En dichos materiales se exponen los contenidos de cada tema, con ilustraciones a través de ejemplos que el alumnado puede ir realizando.

Además de los ejemplos resueltos para ilustrar los contenidos, dentro de cada tema se proponen al alumnado ejercicios sin resolver que habrá de realizar. Estos ejercicios conformarán algunas de las actividades que, en los plazos fijados ya en el calendario, el alumnado deberá entregar a través de la plataforma para la evaluación