Publicación:
Procesamiento del lenguaje natural y fijación del texto. Experiencias en torno a la constitución de un corpus diacrónico de sonetos

dc.contributor.authorBermúdez Sabel, Helena
dc.contributor.authorMartínez Cantón, Clara Isabel
dc.contributor.authorRuiz Fabo, Pablo
dc.contributor.funderMinisterio de Economía, Industria y Competitividad FFI2015-65093-P, Ministerio de Ciencia e Innovación PID2019-107928GB-I00
dc.date.accessioned2025-10-09T07:21:48Z
dc.date.available2025-10-09T07:21:48Z
dc.date.issued2024-01-01
dc.description.abstractEsta contribución surge en el contexto de desarrollo del corpus de sonetos DISCO (Diachronic Spanish Sonnet Corpus), un corpus de 4530 sonetos en español compuestos entre el siglo xvi y el xx por autores de diversas procedencias (Europa, Latinoamérica y Filipinas). Este recurso contiene las anotaciones de diferentes fenómenos de versificación que han sido obtenidas a partir de técnicas del procesamiento del lenguaje natural (PLN). En este artículo presentamos cómo los resultados de la anotación automática pueden ser utilizados para detectar problemas de transmisión textual. Uno de los objetivos de esta contribución es el de proporcionar claves sobre posibles flujos de trabajo que, ayudándose de herramientas de PLN, permitan detectar posibles errores textuales, centrando así los esfuerzos de revisión manual en pasajes concretos.es
dc.description.abstractWe present work carried out within the development of DISCO, the Diachronic Spanish Sonnet Corpus project, which consists of 4,530 sonnets in Spanish from Europe, Latin America and the Philippines, including texts from the 15th to the 20th centuries. The resource offers versification annotations obtained automatically through tools based on Natural Language Processing (NLP). In this article, we present how automatic annotation results can be exploited to detect textual transmission errors. Drawing on our experience with DISCO, we present observations towards the creation of workflows assisted by NLP-based tools, which can help detect possible textual errors, thus allowing us to focus on specific passages for our manual correction effort.en
dc.description.versionversión publicada
dc.identifier.citationBermúdez Sabel, Helena, Clara I. Martínez Cantón, y Pablo Ruiz Fabo. 2024. «Procesamiento del lenguaje natural y fijación del texto. Experiencias en torno a la constitución de un corpus diacrónico de sonetos». En Editar el Siglo de Oro en la era digital, editado por Susanna Allés-Torrent y Eugenia Fosalba. Studia Aurea Monográfica. https://monografies.uab.cat/monografies/catalog/view/sam009/210/302.
dc.identifier.isbn978-84-128138-3-8
dc.identifier.urihttps://hdl.handle.net/20.500.14468/30351
dc.language.isoes
dc.page.final174
dc.page.initial161
dc.publisherStudia Aurea Monográfica
dc.relation.centerFacultad de Filología
dc.relation.departmentLiteratura Española y Teoría de la Literatura
dc.relation.ispartofEditar el Siglo de Oro en la era digital
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/deed.es
dc.subject5505.10 Filología
dc.subject.keywordscorpuses
dc.subject.keywordssonetoes
dc.subject.keywordsprocesamiento del lenguaje naturales
dc.subject.keywordsanotaciónes
dc.subject.keywordsedición digitales
dc.subject.keywordsversificaciónes
dc.subject.keywordsCorpusen
dc.subject.keywordssonneten
dc.subject.keywordsnatural language processingen
dc.subject.keywordsannotationen
dc.subject.keywordsscholarly editingen
dc.subject.keywordsversificationen
dc.titleProcesamiento del lenguaje natural y fijación del texto. Experiencias en torno a la constitución de un corpus diacrónico de sonetoses
dc.typecapítulo de libroes
dc.typebook parten
dspace.entity.typePublication
relation.isAuthorOfPublication7f6db8d1-51cf-49b7-be42-43ccabc9762d
relation.isAuthorOfPublication.latestForDiscovery7f6db8d1-51cf-49b7-be42-43ccabc9762d
Archivos
Bloque original
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
stuarmon_a2024n9p161_Clara Isabel Martíne.pdf
Tamaño:
156.38 KB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.62 KB
Formato:
Item-specific license agreed to upon submission
Descripción:
Colecciones