Subir material

Suba sus trabajos a SEDICI, para mejorar notoriamente su visibilidad e impacto

 

Mostrar el registro sencillo del ítem

dc.date.accessioned 2024-10-18T12:38:11Z
dc.date.available 2024-10-18T12:38:11Z
dc.date.issued 2024-10-01
dc.identifier.uri http://sedici.unlp.edu.ar/handle/10915/171646
dc.description.abstract El presente curso se enfoca en enseñar los fundamentos del procesamiento de lenguaje natural (PLN), minería y análisis automático de textos. A lo largo del curso, los estudiantes aprenderán técnicas básicas y se familiarizarán con herramientas de Python como NLTK y spaCy. Se ejecutan ejemplos prácticos, nubes de palabras y modelado de tópicos. El curso cubre varios términos clave, incluyendo análisis automático de textos, minería de textos y lingüística de corpus, que estudia grandes colecciones de textos para identificar patrones en el uso del lenguaje. Además, se abordan conceptos relacionados como recuperación de la información, aprendizaje automático y profundo. El curso destaca las aplicaciones prácticas del PLN en la vida cotidiana, como los asistentes virtuales, la traducción automática, el análisis de sentimientos y los sistemas de recomendación, y se presenta una breve historia de los hitos del PLN, desde los primeros sistemas basados en reglas hasta los avances modernos con transformers como BERT y GPT. Los temas dados incluyen el preprocesamiento del texto (tokenización, eliminación de palabras vacías, lematización), técnicas de vectorización como Bag of Words y TF-IDF, y análisis más avanzados como etiquetado de partes del discurso y detección de entidades nombradas. En el módulo de minería de textos, se exploran etapas como el enriquecimiento (añadir metadatos), la extracción de características y la aplicación de modelos estadísticos o de aprendizaje automático. También se introduce el modelado de tópicos mediante Latent Dirichlet Allocation (LDA) y su utilidad para identificar temas ocultos en grandes corpus de documentos. es
dc.language es es
dc.subject Procesamiento del Lenguaje Natural (PLN) es
dc.subject Minería de textos es
dc.subject Análisis automático de textos es
dc.subject NLTK es
dc.subject spaCy es
dc.subject Latent Dirichlet Allocation (LDA) es
dc.title Breve Introducción a la Minería de Textos es
dc.type Objeto de aprendizaje es
sedici.creator.person Nusch, Carlos Javier es
sedici.description.note Curso dictado en el marco del VI Congreso Internacional de la Asociación Argentina de Humanidades Digitales. Humanos que piensan con máquinas. (Resistencia, 2024) es
sedici.subject.materias Informática es
sedici.subject.materias Humanidades es
sedici.description.fulltext true es
mods.originInfo.place Dirección PREBI-SEDICI es
sedici.subtype Clase es
sedici.rights.license Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)
sedici.rights.uri http://creativecommons.org/licenses/by-nc-sa/4.0/


Descargar archivos

Este ítem aparece en la(s) siguiente(s) colección(ones)

Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) Excepto donde se diga explícitamente, este item se publica bajo la siguiente licencia Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0)