En éste curso, se abordarán técnicas de análisis de datos en formato textual extraídos de medios digitales. Es un curso fundamentalmente práctico, pero mostrando también los conceptos teóricos necesarios para entender los diferentes modelos de análisis que se abordan.
Se mostran las herramientas y metodologías para la extracción de información en formato textual en medios digitales de la Web. Así como mostrar las principales metodologías de procesamiento de lenguaje natural y Machine Learning (ML) para recuperación de información y análisis de textos, abarcando métodos supervisados (clasificación) y no-supervisados (clustering de texto y análisis de tópicos).