Guía docente de Análisis de Datos. Técnicas Aplicadas a Datos de Proximidad (M42/56/1/31)

Curso 2022/2023
Fecha de aprobación por la Comisión Académica 13/07/2022

Máster

Máster Universitario en Estadística Aplicada

Módulo

Módulo I: Aplicaciones de la Estadística

Rama

Ciencias

Centro Responsable del título

Escuela Internacional de Posgrado

Semestre

Primero

Créditos

4

Tipo

Optativa

Tipo de enseñanza

Enseñanza Virtual

Profesorado

  • José Fernando Vera Vera

Horario de Tutorías

José Fernando Vera Vera

Email
Anual
  • Lunes 11:00 a 12:00 (Despacho 20)
  • Lunes 8:00 a 9:00 (Despacho 20)
  • Miércoles 12:00 a 14:00 (Despacho 20)
  • Miércoles 8:00 a 10:00 (Despacho 20)

Breve descripción de contenidos (Según memoria de verificación del Máster)

Uno de los problemas más interesantes en muchas disciplinas se plantea cuando necesitamos medir y entender las relaciones entre objetos, siendo desconocidas las dimensiones subyacentes de los mismos, especialmente en aquellas situaciones en las que la información disponible se refiere exclusivamente a la semejanza o desemejanza entre los elementos que son motivo de estudio. El análisis multidimensional de estructuras mediante proximidades o Multidimensional Scaling (MDS) puede definirse como un conjunto de técnicas para el análisis de datos de similaridad o de disimilaridad sobre un conjunto de objetos o variables. En general, las medidas de proximidad son modelizadas mediante distancias en un espacio métrico de dimensión baja para obtener una representación visual de la estructura de los datos, lo que además de resultar más fácil de entender que una tabla de datos, permite mostrar la información esencial minimizando las perturbaciones debidas a errores.

Existen diferentes tipos de MDS en función de la geometría utilizada para la representación de los datos, el tratamiento estadístico de los errores, o los procedimientos empleados para encontrar una representación óptima de los mismos, entre otras características. La gran flexibilidad del MDS ha hecho que además, algunos modelos hayan sido combinados teóricamente con otras técnicas tradicionales del Análisis Multivariante como el análisis clúster para facilitar la interpretación de los datos. Desde otra perspectiva, el MDS también ha sido empleado como herramienta fundamental en campos de la estadística tan diferentes como los procesos espacio-temporales.

Dada la gran flexibilidad de la técnica y puesto que no existen soluciones exactas para la estimación de la configuración en MDS, el desarrollo de las técnicas específicas de cada problema en cuestión y su tratamiento computacional constituye una área de investigación muy atractivo y de gran actualidad, en la que las técnicas de optimización heurística juegan un papel importante.

Objetivos particulares

-Introducir al alumno en el análisis de datos de proximidad y en la geometría de la técnica de Multidimensional Scaling (MDS).

-Adquirir los conocimientos y habilidades necesarios en relación con la minería de datos de proximidad y a la metodología del análisis estadístico computacional asociado.

-Describir los principales modelos de MDS y su aplicación mediante el manejo de software estadístico GNU de alto nivel.

-Enseñar a elegir la metodología computacional en relación conl software estadístico más adecuado para cada análisis de datos de proximidad.

-Motivar la búsqueda de información individual y en equipo, así como el estudio y aplicación de nuevas técnicas estadísticas de MDS.

Prerrequisitos y/o Recomendaciones

Es recomendable que el alumno tenga conocimientos del lenguaje R y/o MatLab, así como un nivel medio alto en matemáticas acorde con los requisitos del Máster.

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Competencias Generales

  • CG01. Los titulados han de saber aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio. 
  • CG02. Los titulados han de ser capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios. 
  • CG03. Los titulados han de saber comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades 
  • CG04. Los titulados deben poseer las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo. 
  • CG05. Los titulados han de demostrar una comprensión sistemática del campo de estudio y el dominio de las habilidades y métodos de investigación relacionados con dicho campo. 
  • CG06. Los titulados deben demostrar la capacidad de concebir, diseñar, poner en práctica y adoptar un proceso sustancial de investigación con seriedad académica. 
  • CG07. Los titulados han de realizar una contribución a través de una investigación original que amplíe las fronteras del conocimiento desarrollando un corpus sustancial, del que parte merezca la publicación referenciada a nivel nacional o internacional. 
  • CG08. Los titulados deben ser críticos en el análisis, evaluación y síntesis de ideas nuevas y complejas. 
  • CG09. Los titulados deben saber comunicarse con sus colegas, con la comunidad académica en su conjunto y con la sociedad en general acerca de sus áreas de conocimiento. 
  • CG10. Los titulados han de ser capaces de fomentar, en contextos académicos y profesionales, el avance tecnológico, social o cultural dentro de una sociedad basada en el conocimiento. 

Competencias Específicas

  • CE01. Conocer métodos para el Análisis de Datos 
  • CE02. Conocer diferentes técnicas de Muestreo 
  • CE03. Adquirir conocimientos avanzados en Probabilidad y Procesos Estocásticos 
  • CE04. Profundizar en las técnicas de Modelización Estocástica 
  • CE05. Adquirir conocimientos avanzados en Inferencia Estadística 
  • CE06. Aprender y entender técnicas de Estadística Multivariante 
  • CE07. Saber identificar y aplicar diferentes Modelos Econométricos 
  • CE09. Adquirir conocimientos en Bioestadística 
  • CE10. Dominar el uso de diferentes entornos de Computación Estadística 
  • CE11. Conocer y aplicar técnicas de Control Estadístico de Calidad 
  • CE12. Ser capaz de resolver problemas a través de técnicas de Simulación Estocástica 
  • CE13. Saber llevar a cabo el diseño, programación e implantación programas de computación estadística 
  • CE14. Saber realizar un diseño de experimentos 
  • CE15. Ser capaza de identificar la información relevante para resolver un problema 
  • CE16. Utilizar correcta y racionalmente programas de ordenador de tipo estadístico 
  • CE17. Adquirir capacidades de elaboración y construcción de modelos y su validación 
  • CE18. Ser capaz de realizar un análisis de datos 
  • CE19. Saber gestionar bases de datos 
  • CE20. Ser capaz de realizar una correcta representación gráfica de datos 
  • CE21. Conocer, identificar y seleccionar fuentes estadísticas 

Competencias Transversales

  • CT01. Mostrar interés por la calidad y la excelencia en la realización de diferentes tareas 
  • CT02. Comprender y defender la importancia que la diversidad de culturas y costumbres tienen en la investigación o práctica profesional 
  • CT03. Tener un compromiso ético y social en la aplicación de los conocimientos adquiridos 
  • CT04. Ser capaz de trabajar en equipos interdisciplinarios para alcanzar objetivos comunes desde campos expertos diferenciados. 
  • CT05. Incorporar los principios del Diseño Universal en el desempeño de su profesión 

Resultados de aprendizaje (Objetivos)

El alumno sabrá/comprenderá:

- El análisis de datos de proximidad y en la geometría de la técnica de Multidimensional Scaling (MDS).

- Adquirir los conocimientos y habilidades necesarios en relación a la minería de datos de proximidad y a la metodología del análisis   estadístico computacional asociado.

- Describir los principales modelos de MDS y su aplicación mediante el manejo de software estadístico GNU de alto nivel.

- Elegir la metodología computacional en relación al software estadístico más adecuado para cada análisis de datos de proximidad.

- Buscar información individual y en equipo, así como el estudio y aplicación de nuevas técnicas estadísticas de MDS.

 

El alumno será capaz:

- Aplicar estas técnicas a casos concretos.

Programa de contenidos Teóricos y Prácticos

Teórico

TEMARIO TEÓRICO:

  • Tema 1. Análisis de datos de proximidad. Multidimensional Scaling.
  • Tema 2. MDS clásico. Análisis de coordenadas principales.
  • Tema 3. MDS métrico y no métrico.
  • Tema 4. Diferencias individuales en MDS.
  • Tema 5. Análisis de datos de proximidad con MDS. Unfolding. Procruster. Otros modelos de MDS. Clasificación y MDS

Práctico

TEMARIO PRÁCTICO:

Seminarios/Talleres

  • MDS con R
  • MDS con SPSS

Bibliografía

Bibliografía fundamental

  • BORG, I. & GROENEN, P.J.F. (2005).- Modern Multidimensional Scaling. Theory and Applications. Second Edition.Springer Series in Statistics. Springer.
  • COX, T.F. & COX, M.A.A. (2001).-Multidimensional Scaling. Second Edition. Monographs on statistics and applied probability, 59. London: Chapman Hall.
  • KRUSKAL, B. & WISH, M (1981). Multidimensional Scaling. Sage.
  • MARDIA K.V. & BIBBY, K.J.M. (1997). Multivariate Analysis. London: Academic Press.
  • ARABIE, P. & CARROLL, J.D. & DeSARBO, W. (1987). Three-Way scaling and clustering. Sage.

Bibliografía complementaria

  • HOAGLIN, D., MOSTELLER, F. & TUKEY, J.W.(1983).-Understanding robust and Exploratory Data Analysis. New York. John Wiley & Sons.
  • SEBER, G.A.F. (1984). Multivariate Observations. New York. John Willey.

Metodología docente

  • MD01 Lección magistral/expositiva 
  • MD02 Sesiones de discusión y debate 
  • MD03 Resolución de problemas y estudio de casos prácticos 
  • MD04 Prácticas de laboratorio o clínicas 
  • MD05 Seminarios 
  • MD06 Ejercicios de simulación 
  • MD07 Análisis de fuentes y documentos 
  • MD08 Realización de trabajos en grupo 
  • MD09 Realización de trabajos individuales 

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

Se considerará aprobado el curso y se expedirá el correspondiente certificado de aprovechamiento con la superación del 85% del contenido propuesto, tanto de la parte teórica como práctica. Para la evaluación se tendrá en cuenta:

  • Actitud participativa del alumno (10%)
  • Acceso a la plataforma (módulo de contenidos, glosario, utilización de enlaces web y bibliografía complementaria, etc.) (5%)
  • Participación en foros y chats (10%)
  • Entrega de actividades (40%)
  • Realización de consultas y utilización del resto de herramientas de comunicación (10%)
  • Trabajo final (25%)

Evaluación Extraordinaria

  • Acceso a la plataforma (módulo de contenidos, glosario, utilización de enlaces web y bibliografía complementaria, etc.) (5%)
  • Participación en foros y chats (10%)
  • Entrega de actividades (60%)
  • Trabajo final (25%)

Evaluación única final

  • Los mismos descriptores que la evaluación extraordinaria.

Información adicional

Para el desarrollo de la investigación en este campo se requiere por parte del alumno un conocimiento medio-avanzado en Matemáticas, Estadística y Cálculo de Probabilidades. En particular, es recomendable tener conocimientos medios en Análisis Multivariante y Técnicas de Regresión. Por otra parte, el conocimiento de lenguajes de programación avanzada como R o MatLab, así como paquetes estadísticos avanzados como SPSS es a su vez muy recomendable. Es por tanto aconsejable, aunque no imprescindible, que el alumno haya realizado alguna asignatura relacionada con la Estadística Computacional y el Análisis Exploratorio de Datos.