Guía docente de Análisis de Textos y Redes Sociales (MD6/56/1/5)
Máster
Módulo
Rama
Centro Responsable del título
Semestre
Créditos
Tipo
Tipo de enseñanza
Profesorado
Horario de Tutorías
Breve descripción de contenidos (Según memoria de verificación del Máster)
- Panorama actual del procesamiento del lenguaje natural
- Preprocesamiento de textos
- Representación computacional de los textos
- Análisis de sentimientos
- Clasificación supervisada de textos
- Modelado de temas
- Definición de red social
- Características estructurales básicas
- Visualización y disposición de los nodos
- Tipología de redes y detección de comunidades
Prerrequisitos y/o Recomendaciones
Se recomienda conocimiento básico de estadística.
Competencias
Competencias Básicas
- CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
- CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
- CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
- CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
- CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
Resultados de aprendizaje (Objetivos)
Se espera que los estudiantes obtengan la capacidad de analizar los datos producidos en redes sociales. El objetivo docente es proporcionar a los estudiantes los principales conceptos y técnicas para el análisis computacional y estadístico de datos derivados de plataformas sociales en las que se encuentran fundamentalmente los datos no estructurados. Se busca que se conozcan y entiendan no solo los propios mensajes, sino las propias estructuras de red en las que se producen dichos datos, especialmente en forma de grafos.
Los resultados de aprendizaje esperados son:
- La identificación y aplicación de los principales conceptos y técnicas del procesamiento del lenguaje natural y del aprendizaje automático para el análisis de textos provenientes de redes sociales.
- La identificación y aplicación de los principales conceptos y técnicas del análisis de redes sociales (ARS).
Programa de contenidos Teóricos y Prácticos
Teórico
A partir de los contenidos especificados en la Memoria de Verificación del título establecemos los siguientes bloques temáticos para el desarrollo efectivo del curso:
Panorama actual del procesamiento del lenguaje natural
- Introducción al análisis automatizado de grandes cantidades de textos. Fuentes de datos textuales en redes sociales. Principales conceptos y técnicas del procesamiento del lenguaje natural.
Preprocesamiento de textos
- El texto como cadena de caracteres. Expresiones regulares. Limpieza de datos textuales.
- Representación computacional de los textos
- Tokenización. Matriz término-documento. Bolsa de palabras. Ponderación. N-gramas. Representación avanzada (embeddings). Grandes modelos del lenguaje (BERT, GPT3, etc.)
Análisis de sentimientos
- Análisis de sentimiento con diccionarios. Creación y validación de léxicos. Ventajas y limitaciones de los diccionarios.
Clasificación supervisada de textos
- Aprendizaje automático supervisado aplicado a textos. Principales algoritmos de clasificación. Etiquetado de contenidos y creación de corpus de entrenamiento. Evaluación y validación de los modelos. Análisis supervisado de sentimientos, clasificación binaria y multicategórica de textos.
Modelado de temas
- Aprendizaje automático no supervisado aplicado a textos. El algoritmo Latent Dirichlet Allocation (LDA). Aplicación y validación de modelado de temas.
Definición de red social
- Representación de las redes sociales como grafos. Introducción al análisis de redes sociales (ARS).
Características estructurales básicas
- Tipos de grafos. Caminos en un grafo y accesibilidad.
Visualización y disposición de los nodos
- Medidas de centralidad. Visualización interactiva de los grafos.
Tipología de redes y detección de comunidades
- Agrupación y algoritmos de detección de comunidades.
Nota: la programación temática se desarrolla sobre la base de los principios básicos establecidos en la Memoria de Verificación y Modificación del Título
Práctico
- Panorama actual del procesamiento del lenguaje natural. Discusión de los conceptos en clase
- Preprocesamiento de textos. Ejercicio en clase en R y Python
- Representación computacional de los textos. Discusión de los conceptos en clase
- Análisis de sentimientos. Ejercicio en clase en R y Python
- Clasificación supervisada de textos. Ejercicio en clase en R y Python
- Modelado de temas. Ejercicio en clase en R y Python
- Definición de red social. Discusión de los conceptos en clase.
- Características estructurales básicas. Ejercicio en clase en R
- Tipología de redes y detección de comunidades. Ejercicio en clase en R
Bibliografía
Bibliografía fundamental
Van Atteveldt, W., Trilling, D., & Calderon, C. A. (2022). Computational analysis of communication. John Wiley & Sons.
Bibliografía complementaria
Arcila, C., Mohedano, F. O., Álvarez, M., & Mariño, M. V. (2019). Distributed supervised sentiment analysis of tweets: Integrating machine learning and streaming analytics for big data challenges in communication and audience research. Empiria: Revista de metodología de ciencias sociales, (42), 113-136.
Benoit, Kenneth, Kohei Watanabe, Haiyan Wang, Paul Nulty, Adam Obeng, Stefan Müller, and Akitaka Matsuo. 2018. “Quanteda: An r Package for the Quantitative Analysis of Textual Data.”Journal of Open Source Software 3 (30): 774. https://doi.org/10.21105/joss.00774.
Blei, David M, and John D Lafferty. 2006. “Dynamic Topic Models.” In Proceedings of the 23rd International Conference on Machine Learning, 113–20.
Blei, David M, Andrew Y Ng, and Michael I Jordan. 2003. “Latent Dirichlet Allocation.” Journal of Machine Learning Research 3 (Jan): 993–1022
Bird, S., Klein, E., & Loper, E. (2009). Natural language processing with Python: analyzing text with the natural language toolkit. O'Reilly Media, Inc.
Boukes, Mark, Bob van de Velde, Theo Araujo, and Rens Vliegenthart. 2019. “What’s the Tone? Easy Doesn’t Do It: Analyzing Performance and Agreement Between Off-the-Shelf Sentiment Analysis Tools.” Communication Methods and Measures 00 (00): 1–22. https://doi.org/10.1080/19312458.2019.1671966.
Escobar M, Martinez-Uribe L (2020). “Network Coincidence Analysis: The netCoin R Package.” Journal of Statistical Software, 93(11), 1-32. doi: 10.18637/jss.v093.i11 (URL: https://doi.org/10.18637/jss.v093.i11)
Géron, A. (2019). Hands-on machine learning with Scikit-Learn, Keras, and TensorFlow: Concepts, tools, and techniques to build intelligent systems. O'Reilly Media, Inc..
Goldberg, Yoav. 2017. Neural Network Models for Natural Language Processing. Morgan & Claypool.
Krippendorff, Klaus. 2004. Content Analysis: An Introduction to Its Methodology. 2nd ed. Thousand Oaks, CA: SAGE.
Newman, Mark EJ, and Michelle Girvan. 2004. “Finding and Evaluating Community Structure in Networks.” Physical Review E 69 (2): 026113.
Raghavan, Usha Nandini, Réka Albert, and Soundar Kumara. 2007. “Near Linear Time Algorithm to Detect Community Structures in Large-Scale Networks.” Physical Review E 76 (3): 036106.
Reagan, Andrew J., Christopher M. Danforth, Brian Tivnan, Jake Ryland Williams, and Peter Sheridan Dodds. 2017. “Sentiment analysis methods for understanding large-scale texts: a case for using continuum-scored words and word shift graphs.” EPJ Data Science 6 (1). https://doi.org/10.1140/epjds/s13688-017-0121-9.
Silge, J., & Robinson, D. (2016). tidytext: Text mining and analysis using tidy data principles in R. Journal of Open Source Software, 1(3), 37.
Enlaces recomendados
Metodología docente
Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)
Evaluación Ordinaria
Siguiendo las normativas de Evaluación y Calificación del Estudiantado de la Universidad de Granada y la Universidad de Salamanca se establece que la convocatoria ordinaria estará basada preferentemente en la evaluación continua del estudiante, excepto para quienes se le haya reconocido el derecho a la evaluación única final.
La calificación final de cada alumno/a se obtendrá mediante la evaluación de:
- Participación en los debates de clase (20%)
- Evaluación de ejercicio práctico de análisis de sentimientos en redes sociales (10%)
- Evaluación de ejercicio práctico de modelado de temas en redes sociales (10%)
- Evaluación de ejercicio práctico de análisis de redes sociales (20%)
- Trabajo final individual de un proyecto de análisis de textos de redes sociales (30%)
Sistema de Evaluación |
Ponderación mínima (%) |
Ponderación máxima (%) |
SE1. Resolución, individual o colectiva, de pruebas, ejercicios y/o problemas desarrollados en clase, en la institución o en la empresa. |
20 |
40 |
SE4. Intervención en debates virtuales |
20 |
40 |
SE10. Elaboración y presentación de proyecto de investigación social donde se aplique la ciencia de datos |
30 |
50 |
CRITERIOS DE EVALUACIÓN:
Se tendrá en cuenta que en el proceso de aprendizaje cada estudiante haya aprendido los siguientes aspectos:
-Manejo de las principales técnicas del procesamiento del lenguaje natural
-Comprensión de los modelos de representación matemática de los textos
-Aplicación de los principales métodos computacionales de análisis de texto
-Comprensión del uso del aprendizaje automático en el análisis de textos y redes sociales
-Comprensión de las estructuras de datos en forma de grafos y su aplicación en ciencias sociales
-Manejo de los principales conceptos y técnicas de análisis de redes sociales
Evaluación Extraordinaria
Siguiendo las normativas de Evaluación y Calificación del Estudiantado de la Universidad de Granada y la Universidad de Salamanca se establece que los estudiantes que no hayan superado la asignatura en la convocatoria ordinaria dispondrán de una convocatoria extraordinaria. A ella podrán concurrir todos los estudiantes, con independencia de haber seguido o no un proceso de evaluación continua. De esta forma, el estudiante que no haya realizado la evaluación continua tendrá la posibilidad de obtener el 100% de la calificación mediante la realización de una prueba escrita con carácter presencial.
La evaluación extraordinaria consistirá en una prueba única de carácter teórico-práctico en el que se evaluarán los contenidos de la bibliografía obligatoria.
CRITERIOS DE EVALUACIÓN:
Se tendrá en cuenta que en el proceso de aprendizaje cada estudiante haya aprendido los siguientes aspectos:
-Manejo de las principales técnicas del procesamiento del lenguaje natural
-Comprensión de los modelos de representación matemática de los textos
-Aplicación de los principales métodos computacionales de análisis de texto
-Comprensión del uso del aprendizaje automático en el análisis de textos y redes sociales
-Comprensión de las estructuras de datos en forma de grafos y su aplicación en ciencias sociales
-Manejo de los principales conceptos y técnicas de análisis de redes sociales
Evaluación única final
Siguiendo las normativas de Evaluación y Calificación del Estudiantado de la Universidad de Granada y la Universidad de Salamanca se establece que podrán acogerse a la evaluación única final, el estudiantado que no pueda cumplir con el método de evaluación continua por causas justificadas.
Para acogerse a la evaluación única final, el estudiante, en las dos primeras semanas de impartición de la asignatura o en las dos semanas siguientes a su matriculación si esta se ha producido con posterioridad al inicio de las clases o por causa sobrevenidas. Lo solicitará, a través del procedimiento electrónico, a la Coordinación del Máster, quien dará traslado al profesorado correspondiente, alegando y acreditando las razones que le asisten para no poder seguir el sistema de evaluación continua.
Prueba de la asignatura donde se valorará que el estudiantado haya interiorizado los siguientes aspectos:
-Manejo de las principales técnicas del procesamiento del lenguaje natural
-Comprensión de los modelos de representación matemática de los textos
-Aplicación de los principales métodos computacionales de análisis de texto
-Comprensión del uso del aprendizaje automático en el análisis de textos y redes sociales
-Comprensión de las estructuras de datos en forma de grafos y su aplicación en ciencias sociales
-Manejo de los principales conceptos y técnicas de análisis de redes sociales
Información adicional
Actividades formativas:
AF1. Clases Teóricas.
AF2. Clases Prácticas.
AF3. Trabajo con documentos científicos.
AF7. Tutorías en grupo.
AF8. Trabajo autónomo y/o colaborativo del estudiante para la generación de conocimiento individual y/o compartido (portafolio, diario de campo, memoria de prácticas, …)
AF12. Elaboración de trabajos de iniciación a la investigación o de intervención
AF13. Exposición presencial y pública de trabajos
Metodologías Docentes:
MD1. Lección Magistral Participativa
MD2. Aprendizaje Basado en Problemas/Proyectos
MD8. Laboratorio y trabajos prácticos
Información de interés para estudiantado con discapacidad y/o Necesidades Específicas de Apoyo Educativo (NEAE): Gestión de servicios y apoyos (https://ve.ugr.es/servicios/atencion-social/estudiantes-con-discapacidad).