Guía docente de Análisis de Textos y Redes Sociales (MD6/56/1/5)

Curso 2024/2025
Fecha de aprobación por la Comisión Académica 21/06/2024

Máster

Máster Universitario en Ciencia de Datos Aplicada a las Ciencias Sociales

Módulo

Herramientas de la Ciencia de Datos Aplicada a las Ciencias Sociales

Rama

Ciencias Sociales y Jurídicas

Centro Responsable del título

Escuela Internacional de Posgrado

Semestre

Primero

Créditos

4.5

Tipo

Obligatorio

Tipo de enseñanza

Enseñanza Virtual

Profesorado

Horario de Tutorías

Breve descripción de contenidos (Según memoria de verificación del Máster)

  1. Panorama actual del procesamiento del lenguaje natural
  2. Preprocesamiento de textos
  3. Representación computacional de los textos
  4. Análisis de sentimientos
  5. Clasificación supervisada de textos
  6. Modelado de temas
  7. Definición de red social
  8. Características estructurales básicas
  9. Visualización y disposición de los nodos
  10. Tipología de redes y detección de comunidades

Prerrequisitos y/o Recomendaciones

Se recomienda conocimiento básico de estadística.

Competencias

Competencias Básicas

  • CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
  • CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
  • CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
  • CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
  • CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

Resultados de aprendizaje (Objetivos)

Se espera que los estudiantes obtengan la capacidad de analizar los datos producidos en redes sociales. El objetivo docente es proporcionar a los estudiantes los principales conceptos y técnicas para el análisis computacional y estadístico de datos derivados de plataformas sociales en las que se encuentran fundamentalmente los datos no estructurados. Se busca que se conozcan y entiendan no solo los propios mensajes, sino las propias estructuras de red en las que se producen dichos datos, especialmente en forma de grafos.

Los resultados de aprendizaje esperados son:

  1. La identificación y aplicación de los principales conceptos y técnicas del procesamiento del lenguaje natural y del aprendizaje automático para el análisis de textos provenientes de redes sociales.
  2. La identificación y aplicación de los principales conceptos y técnicas del análisis de redes sociales (ARS).

Programa de contenidos Teóricos y Prácticos

Teórico

A partir de los contenidos especificados en la Memoria de Verificación del título establecemos los siguientes bloques temáticos para el desarrollo efectivo del curso:

Panorama actual del procesamiento del lenguaje natural

  • Introducción al análisis automatizado de grandes cantidades de textos. Fuentes de datos textuales en redes sociales. Principales conceptos y técnicas del procesamiento del lenguaje natural.

Preprocesamiento de textos

  • El texto como cadena de caracteres. Expresiones regulares. Limpieza de datos textuales.
  • Representación computacional de los textos
  • Tokenización. Matriz término-documento. Bolsa de palabras. Ponderación. N-gramas. Representación avanzada (embeddings). Grandes modelos del lenguaje (BERT, GPT3, etc.)

Análisis de sentimientos

  • Análisis de sentimiento con diccionarios. Creación y validación de léxicos. Ventajas y limitaciones de los diccionarios.

Clasificación supervisada de textos

  • Aprendizaje automático supervisado aplicado a textos. Principales algoritmos de clasificación. Etiquetado de contenidos y creación de corpus de entrenamiento. Evaluación y validación de los modelos. Análisis supervisado de sentimientos, clasificación binaria y multicategórica de textos.

Modelado de temas

  • Aprendizaje automático no supervisado aplicado a textos. El algoritmo Latent Dirichlet Allocation (LDA). Aplicación y validación de modelado de temas.

Definición de red social

  • Representación de las redes sociales como grafos. Introducción al análisis de redes sociales (ARS).

Características estructurales básicas

  • Tipos de grafos. Caminos en un grafo y accesibilidad.

Visualización y disposición de los nodos

  • Medidas de centralidad. Visualización interactiva de los grafos.

Tipología de redes y detección de comunidades

  • Agrupación y algoritmos de detección de comunidades.

Nota: la programación temática se desarrolla sobre la base de los principios básicos establecidos en la Memoria de Verificación y Modificación del Título

Práctico

  1. Panorama actual del procesamiento del lenguaje natural. Discusión de los conceptos en clase
  2. Preprocesamiento de textos. Ejercicio en clase en R y Python
  3. Representación computacional de los textos. Discusión de los conceptos en clase
  4. Análisis de sentimientos. Ejercicio en clase en R y Python
  5. Clasificación supervisada de textos. Ejercicio en clase en R y Python
  6. Modelado de temas. Ejercicio en clase en R y Python
  7. Definición de red social. Discusión de los conceptos en clase.
  8. Características estructurales básicas. Ejercicio en clase en R
  9. Tipología de redes y detección de comunidades. Ejercicio en clase en R

Bibliografía

Bibliografía fundamental

Van Atteveldt, W., Trilling, D., & Calderon, C. A. (2022). Computational analysis of communication. John Wiley & Sons.

Bibliografía complementaria

Arcila, C., Mohedano, F. O., Álvarez, M., & Mariño, M. V. (2019). Distributed supervised sentiment analysis of tweets: Integrating machine learning and streaming analytics for big data challenges in communication and audience research. Empiria: Revista de metodología de ciencias sociales, (42), 113-136.

Benoit, Kenneth, Kohei Watanabe, Haiyan Wang, Paul Nulty, Adam Obeng, Stefan Müller, and Akitaka Matsuo. 2018. “Quanteda: An r Package for the Quantitative Analysis of Textual Data.”Journal of Open Source Software 3 (30): 774. https://doi.org/10.21105/joss.00774.

Blei, David M, and John D Lafferty. 2006. “Dynamic Topic Models.” In Proceedings of the 23rd International Conference on Machine Learning, 113–20.

Blei, David M, Andrew Y Ng, and Michael I Jordan. 2003. “Latent Dirichlet Allocation.” Journal of Machine Learning Research 3 (Jan): 993–1022

Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python: analyzing text with the natural language toolkit. O'Reilly Media, Inc.

Boukes, Mark, Bob van de Velde, Theo Araujo, and Rens Vliegenthart. 2019. “What’s the Tone? Easy Doesn’t Do It: Analyzing Performance and Agreement Between Off-the-Shelf Sentiment Analysis Tools.” Communication Methods and Measures 00 (00): 1–22. https://doi.org/10.1080/19312458.2019.1671966.

Escobar M, Martinez-Uribe L (2020). “Network Coincidence Analysis: The netCoin R Package.” Journal of Statistical Software, 93(11), 1-32. doi: 10.18637/jss.v093.i11 (URL: https://doi.org/10.18637/jss.v093.i11)

Géron, A. (2019). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, tools, and techniques to build intelligent systems. O'Reilly Media, Inc..

Goldberg, Yoav. 2017. Neural Network Models for Natural Language Processing. Morgan & Claypool.

Krippendorff, Klaus. 2004. Content Analysis: An Introduction to Its Methodology. 2nd ed. Thousand Oaks, CA: SAGE.

Newman, Mark EJ, and Michelle Girvan. 2004. “Finding and Evaluating Community Structure in Networks.” Physical Review E 69 (2): 026113.

Raghavan, Usha Nandini, Réka Albert, and Soundar Kumara. 2007. “Near Linear Time Algorithm to Detect Community Structures in Large-Scale Networks.” Physical Review E 76 (3): 036106.

Reagan, Andrew J., Christopher M. Danforth, Brian Tivnan, Jake Ryland Williams, and Peter Sheridan Dodds. 2017. “Sentiment analysis methods for understanding large-scale texts: a case for using continuum-scored words and word shift graphs.” EPJ Data Science 6 (1). https://doi.org/10.1140/epjds/s13688-017-0121-9.

Silge, J., & Robinson, D. (2016). tidytext: Text mining and analysis using tidy data principles in R. Journal of Open Source Software, 1(3), 37.

Metodología docente

Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)

Evaluación Ordinaria

Siguiendo las normativas de Evaluación y Calificación del Estudiantado de la Universidad de Granada y la Universidad de Salamanca se establece que la convocatoria ordinaria estará basada preferentemente en la evaluación continua del estudiante, excepto para quienes se le haya reconocido el derecho a la evaluación única final.

La calificación final de cada alumno/a se obtendrá mediante la evaluación de:

  1. Participación en los debates de clase (20%)
  2. Evaluación de ejercicio práctico de análisis de sentimientos en redes sociales (10%)
  3. Evaluación de ejercicio práctico de modelado de temas en redes sociales (10%)
  4. Evaluación de ejercicio práctico de análisis de redes sociales (20%)
  5. Trabajo final individual de un proyecto de análisis de textos de redes sociales (30%)

Sistema de Evaluación

Ponderación mínima

(%)

Ponderación máxima

(%)

SE1. Resolución, individual o colectiva, de pruebas, ejercicios y/o problemas desarrollados en clase, en la institución o en la empresa.

20

40

SE4. Intervención en debates virtuales

20

40

SE10. Elaboración y presentación de proyecto de investigación social donde se aplique la ciencia de datos

30

50

CRITERIOS DE EVALUACIÓN:

Se tendrá en cuenta que en el proceso de aprendizaje cada estudiante haya aprendido los siguientes aspectos:

-Manejo de las principales técnicas del procesamiento del lenguaje natural
-Comprensión de los modelos de representación matemática de los textos
-Aplicación de los principales métodos computacionales de análisis de texto
-Comprensión del uso del aprendizaje automático en el análisis de textos y redes sociales
-Comprensión de las estructuras de datos en forma de grafos y su aplicación en ciencias sociales
-Manejo de los principales conceptos y técnicas de análisis de redes sociales

 

Evaluación Extraordinaria

Siguiendo las normativas de Evaluación y Calificación del Estudiantado de la Universidad de Granada y la Universidad de Salamanca se establece que los estudiantes que no hayan superado la asignatura en la convocatoria ordinaria dispondrán de una convocatoria extraordinaria. A ella podrán concurrir todos los estudiantes, con independencia de haber seguido o no un proceso de evaluación continua. De esta forma, el estudiante que no haya realizado la evaluación continua tendrá la posibilidad de obtener el 100% de la calificación mediante la realización de una prueba escrita con carácter presencial.

La evaluación extraordinaria consistirá en una prueba única de carácter teórico-práctico en el que se evaluarán los contenidos de la bibliografía obligatoria.

CRITERIOS DE EVALUACIÓN:

Se tendrá en cuenta que en el proceso de aprendizaje cada estudiante haya aprendido los siguientes aspectos:

-Manejo de las principales técnicas del procesamiento del lenguaje natural
-Comprensión de los modelos de representación matemática de los textos
-Aplicación de los principales métodos computacionales de análisis de texto
-Comprensión del uso del aprendizaje automático en el análisis de textos y redes sociales
-Comprensión de las estructuras de datos en forma de grafos y su aplicación en ciencias sociales
-Manejo de los principales conceptos y técnicas de análisis de redes sociales

Evaluación única final

Siguiendo las normativas de Evaluación y Calificación del Estudiantado de la Universidad de Granada y la Universidad de Salamanca se establece que podrán acogerse a la evaluación única final, el estudiantado que no pueda cumplir con el método de evaluación continua por causas justificadas.

Para acogerse a la evaluación única final, el estudiante, en las dos primeras semanas de impartición de la asignatura o en las dos semanas siguientes a su matriculación si esta se ha producido con posterioridad al inicio de las clases o por causa sobrevenidas. Lo solicitará, a través del procedimiento electrónico, a la Coordinación del Máster, quien dará traslado al profesorado correspondiente, alegando y acreditando las razones que le asisten para no poder seguir el sistema de evaluación continua.

Prueba de la asignatura donde se valorará que el estudiantado haya interiorizado los siguientes aspectos:

-Manejo de las principales técnicas del procesamiento del lenguaje natural
-Comprensión de los modelos de representación matemática de los textos
-Aplicación de los principales métodos computacionales de análisis de texto
-Comprensión del uso del aprendizaje automático en el análisis de textos y redes sociales
-Comprensión de las estructuras de datos en forma de grafos y su aplicación en ciencias sociales
-Manejo de los principales conceptos y técnicas de análisis de redes sociales

Información adicional

Actividades formativas:

AF1. Clases Teóricas. 

AF2. Clases Prácticas. 

AF3. Trabajo con documentos científicos. 

AF7. Tutorías en grupo. 

AF8. Trabajo autónomo y/o colaborativo del estudiante para la generación de conocimiento individual y/o compartido (portafolio, diario de campo, memoria de prácticas, …)

AF12. Elaboración de trabajos de iniciación a la investigación o de intervención

AF13. Exposición presencial y pública de trabajos

Metodologías Docentes: 

MD1. Lección Magistral Participativa

MD2. Aprendizaje Basado en Problemas/Proyectos

MD8. Laboratorio y trabajos prácticos

Información de interés para estudiantado con discapacidad y/o Necesidades Específicas de Apoyo Educativo (NEAE): Gestión de servicios y apoyos (https://ve.ugr.es/servicios/atencion-social/estudiantes-con-discapacidad).