Guía docente de Big Data I (M51/56/3/35)

Curso 2024/2025
Fecha de aprobación por la Comisión Académica 19/07/2024

Máster

Máster Universitario en Ciencia de Datos e Ingeniería de Computadores

Módulo

Módulo Big Data y Cloud Computing

Rama

Ingeniería y Arquitectura

Centro Responsable del título

Escuela Internacional de Posgrado

Semestre

Segundo

Créditos

4

Tipo

Optativa

Tipo de enseñanza

Presencial

Profesorado

  • José Manuel Benítez Sánchez
  • Ignacio José Blanco Medina
  • Juan Miguel Medina Rodríguez

Horario de Tutorías

José Manuel Benítez Sánchez

Email
Tutorías 2º semestre
  • Martes 17:00 a 19:00 (D31 (Etsiit))
  • Jueves 17:30 a 18:30 (D31 (Etsiit))
  • Jueves 10:30 a 13:30 (D31 (Etsiit))

Ignacio José Blanco Medina

Email
  • Tutorías 1º semestre
    • Martes 10:00 a 13:00 (D27 (Etsiit))
    • Jueves 10:00 a 13:00 (D27 (Etsiit))
  • Tutorías 2º semestre
    • Miércoles 10:00 a 13:00 (D27 (Etsiit))
    • Jueves 10:00 a 13:00 (D27 (Etsiit))

Juan Miguel Medina Rodríguez

Email
  • Tutorías 1º semestre
    • Jueves 8:30 a 14:30 (D35 (Etsiit))
  • Tutorías 2º semestre
    • Martes 8:30 a 12:30 (D35 (Etsiit))
    • Miércoles 12:30 a 13:30 (D35 (Etsiit))
    • Viernes 10:30 a 11:30 (D35 (Etsiit))

Breve descripción de contenidos (Según memoria de verificación del Máster)

CloudComputing. Tecnologías para el procesamiento de datos en la nube.
Almacenamiento Masivo de Datos: Datawarehouse, NoSQL, bases de datos no estructuradas.

Prerrequisitos y/o Recomendaciones

  • Conocimiento básico del S.O. Linux: uso y acceso remoto a servidores (ssh).
  • Conocimientos de programación de ordenadores.
  • Conocimientos básicos de bases de datos.

 

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias Generales

  • CG01. Capacidad de acceso y gestión de la información 
  • CG02. Capacidad de análisis y síntesis 
  • CG03. Capacidad de organización y planificación 
  • CG04. Capacidad emprendedora 
  • CG05. Capacidad para tomar decisiones de forma autónoma 
  • CG07. Motivación por la calidad 
  • CG08. Capacidad para trabajar en equipo 

Competencias Específicas

  • CE03. Capacidad para la aplicación de técnicas y metodologías que permitan abordar desde nuevas perspectivas los problemas de interés, gracias a la disponibilidad de las plataformas de computación y comunicación con altos niveles de prestaciones. 
  • CE04. Capacidad de análisis de aplicaciones en ámbitos de biomedicina y bioinformática, optimización y predicción, control avanzado, y robótica bioinspirada, tanto desde el punto de vista de los requisitos para una implementación eficaz de los algoritmos y las técnicas de computación que se usan para abordarlas, como de las características deseables en las arquitecturas donde se ejecutan 
  • CE05. Capacidad para modelar y resolver problemas reales o académicos mediante técnicas de ciencia de datos 
  • CE06. Capacidad para modelar y resolver problemas reales o académicos mediante tecnologías inteligentes o de inteligencia computacional. 
  • CE08. Conocer algunas de las principales aplicaciones de la ciencia de datos y de las tecnologías inteligentes 

Competencias Transversales

  • CT01. Ser consciente de la importancia del desarrollo sostenible y demostrar sensibilidad medioambiental. 
  • CT02. Ser consciente del derecho a la no discriminación y al acceso universal al conocimiento de las personas con discapacidad. 

Resultados de aprendizaje (Objetivos)

El alumno aprenderá a manejar las tecnologías de cloud computing, y almacenamiento y procesamiento de grandes volúmenes de datos bajo las tecnologías actuales de Big Data tales como Hadoop y Spark, ası́ como su procesamiento en bases de datos. En particular, el alumno:

  • Conocerá y manejará la instalación de sistemas de cloud computing, servidores de Big Data bajo el ecosistema Hadoop, ası́ como el diseño de servicios
  • Aprenderá a manejar bases de datos NoSQL en la nube.
  • Sabrá aplicar las técnicas anteriormente mencionadas para modelar y resolver problemas reales o académicos de big data.
  • Conocerá las principales herramientas software existentes para el manejo de informació n en la nube y la tecnologıá big data: HIVE, PIG ...

Programa de contenidos Teóricos y Prácticos

Teórico

  1. Introducción a Cloud Computing
    • Concepto de computación en la nube.
    • Niveles de servicios cloud.
    • Diseño y despliegue de contenedores.
    • Introducción a Big Data.
  2. Big Data: Almacenamiento de datos masivos
    • Introducción a las bases de datos NoSQL.
  3. Procesamiento y almacenamiento de datos.
    • Ecosistema Hadoop. 

Práctico

  1. Introducción a Cloud Computing
    • Despliegue de máquinas virtuales y contenedores.
    • Aplicaciones de cloud compting: Big Data con Spark.
  2. Big Data: Almacenamiento de datos masivos
    • Uso y aplicación de herramientas de bases de datos NoSQL: MongoDB
  3. Big Data: Procesamiento.
    • Aplicación de Apache Impala.

 

Bibliografía

Bibliografía fundamental

  • R. Buyya, J. Broberg, A. Goscinski, (ed.) “Cloud Computing. Principles and Paradigms”, Wiley, 2011
  • K. Chodorow, “MongoDB. The Definitive Guide”, O’Reilly, 2013
  • J. Hurwitz, M. Kaufman, F. Halper, R. Bloor, “Cloud Computing for Dummies”, Wiley, 2010
  • N. Marz, J. Warren, “Big Data: Principles and best practices of scalable realtime data systems”, Manning, 2014

Bibliografía complementaria

  • S.P. Kane, "Docker Up & Running: Shipping Reliable Containers in Production", O'Reilly, 2018.
  • H. Karau, et al. "Learning Spark: Lightning-Fast Big Data Analysis", O'Reilly, 2015.
  • I. Mell, "Docker in Practice", Manning, 2015.
  • K. Morris, "Infrastructure as Code: Managing Servers in the Cloud", O'Reilly, 2015.

 

Metodología docente

  • MD01 Lección magistral/expositiva 
  • MD02 Resolución de problemas y estudio de casos prácticos 
  • MD03 Prácticas de laboratorio 
  • MD04 Seminarios 
  • MD05 Análisis de fuentes y documentos 
  • MD06 Realización de trabajos en grupo 
  • MD07 Realización de trabajos individuales 
  • MD08 Seguimiento del TFM 

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

El método de evaluación consistirá en:

  • La parte de Cloud Computing supondrá un 50% de la calificación global de la asignatura y se evaluará mediante cuestionarios o exámenes escritos con múltiples preguntas sobre la materia (25%) y la realización de un trabajo práctico sobre el uso de tecnologías cloud (25%).
  • La parte de Almacenamiento de Datos Masivos supondrá un 40% de la calificación global de la asignatura y se evaluará mediante un trabajo práctico. Se le entregará a cada alumno una base de datos para construirla sobre MongoDB y se pedirá que aplique las herramientas estudiadas para responder a una serie de cuestiones planteadas sobre ella.
  • La parte de procesamiento mediante Apache Impala supondrá un 10% de la calificación final. Se evaluará mediante un trabajo práctico que consistirá en:
    • la selección de un conjunto de datos experimental
    • la realización de transformaciones mediante ImpalaQL sobre el conjunto seleccionado.

Para la evaluación, se hará uso de las plataformas docentes y herramientas de trabajo colaborativo proporcionadas por la Universidad de Granada.

Para obtener una calificación en la asignatura, será obligatorio realizar la evaluación de todas las partes de la asignatura y que la calificación global iguale o supere la calificación de 5 sobre 10. 

Si no se supera la asignatura en la Convocatoria Ordinaria, el estudiante o la estudiante podrán optar por conservar la calificación de aquella parte o aquellas partes que superen la calificación de 5 sobre 10 para la Convocatoria Extraordinaria.

Evaluación Extraordinaria

El método de evaluación consistirá en:

  • La parte de Cloud Computing supondrá un 50% de la calificación global de la asignatura y se evaluará mediante cuestionarios o exámenes escritos con múltiples preguntas sobre la materia (25%) y la resolución de ejercicios prácticos usando herramientas de tecnología cloud (25%).
  • La parte de Almacenamiento de Datos Masivos supondrá un 40% de la calificación global de la asignatura y se evaluará mediante un trabajo práctico. Se le entregará a cada alumno una base de datos para construirla sobre MongoDB y se pedirá que aplique las herramientas estudiadas para responder a una serie de cuestiones planteadas sobre ella.
  •  La parte de procesamiento mediante Apache Impala supondrá un 10% de la calificación final y se evaluará mediante un trabajo práctico que consistirá en:
    • la selección de un conjunto de datos experimental
    • la realización de transformaciones mediante ImpalaQL sobre el conjunto seleccionado.

Para obtener una calificación en la asignatura, será obligatorio realizar la evaluación de todas las partes de la asignatura y que la calificación global iguale o supere la calificación de 5 sobre 10. 

Si fuera el caso de que estudiante que hubiese obtenido una calificación igual o superior a 5 sobre 10 en la evaluación de alguna de las partes referidas anteriormente en la convocatoria ordinaria no tendrá obligación de volver ser evaluado de esa parte en la convocatoria extraordinaria, pudiendo conservar la obtenida en la convocatoria ordinaria.

Para obtener una calificación en la asignatura, será obligatorio obtener calificación en todas las partes de la asignatura y que la calificación global iguale o supere la calificación de 5 sobre 10. 

Evaluación única final

Alternativamente a la evaluación continua, el alumno puede optar por la evaluación única final según lo dispuesto en la normativa de evaluación y de calificación de los estudiantes de la Universidad de Granada (http://secretariageneral.ugr.es/pages/normativa/ugr/ncg7121). Para acogerse a la evaluación única final, el estudiante, en las dos primeras semanas de impartición de la asignatura, lo solicitará al Coordinador del Máster, quien dará traslado al profesorado correspondiente, alegando y acreditando las razones que le asisten para no poder seguir el sistema de evaluació n continua.

La evaluación única final se realizará en un solo acto académico. Dicha prueba (evaluada de 0 a 10) incluirá pruebas tanto de tipo teórico como práctico que garanticen que el alumno ha adquirido la totalidad de las competencias descritas en esta guıá docente.

Información adicional

Información de interés para estudiantado con discapacidad y/o Necesidades Específicas de Apoyo Educativo (NEAE): Gestión de servicios y apoyos (https://ve.ugr.es/servicios/atencion-social/estudiantes-con-discapacidad).