Busque entre los 166285 recursos disponibles en el repositorio
Mostrar el registro sencillo del ítem
dc.date.accessioned | 2024-10-18T12:38:11Z | |
dc.date.available | 2024-10-18T12:38:11Z | |
dc.date.issued | 2024-10-01 | |
dc.identifier.uri | http://sedici.unlp.edu.ar/handle/10915/171646 | |
dc.description.abstract | El presente curso se enfoca en enseñar los fundamentos del procesamiento de lenguaje natural (PLN), minería y análisis automático de textos. A lo largo del curso, los estudiantes aprenderán técnicas básicas y se familiarizarán con herramientas de Python como NLTK y spaCy. Se ejecutan ejemplos prácticos, nubes de palabras y modelado de tópicos. El curso cubre varios términos clave, incluyendo análisis automático de textos, minería de textos y lingüística de corpus, que estudia grandes colecciones de textos para identificar patrones en el uso del lenguaje. Además, se abordan conceptos relacionados como recuperación de la información, aprendizaje automático y profundo. El curso destaca las aplicaciones prácticas del PLN en la vida cotidiana, como los asistentes virtuales, la traducción automática, el análisis de sentimientos y los sistemas de recomendación, y se presenta una breve historia de los hitos del PLN, desde los primeros sistemas basados en reglas hasta los avances modernos con transformers como BERT y GPT. Los temas dados incluyen el preprocesamiento del texto (tokenización, eliminación de palabras vacías, lematización), técnicas de vectorización como Bag of Words y TF-IDF, y análisis más avanzados como etiquetado de partes del discurso y detección de entidades nombradas. En el módulo de minería de textos, se exploran etapas como el enriquecimiento (añadir metadatos), la extracción de características y la aplicación de modelos estadísticos o de aprendizaje automático. También se introduce el modelado de tópicos mediante Latent Dirichlet Allocation (LDA) y su utilidad para identificar temas ocultos en grandes corpus de documentos. | es |
dc.language | es | es |
dc.subject | Procesamiento del Lenguaje Natural (PLN) | es |
dc.subject | Minería de textos | es |
dc.subject | Análisis automático de textos | es |
dc.subject | NLTK | es |
dc.subject | spaCy | es |
dc.subject | Latent Dirichlet Allocation (LDA) | es |
dc.title | Breve Introducción a la Minería de Textos | es |
dc.type | Objeto de aprendizaje | es |
sedici.creator.person | Nusch, Carlos Javier | es |
sedici.description.note | Curso dictado en el marco del VI Congreso Internacional de la Asociación Argentina de Humanidades Digitales. Humanos que piensan con máquinas. (Resistencia, 2024) | es |
sedici.subject.materias | Informática | es |
sedici.subject.materias | Humanidades | es |
sedici.description.fulltext | true | es |
mods.originInfo.place | Dirección PREBI-SEDICI | es |
sedici.subtype | Clase | es |
sedici.rights.license | Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) | |
sedici.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ |