CORPUS DE NOVELAS DE LA EDAD DE PLATA, EN XML-TEI
DOI:
https://doi.org/10.5944/signa.vol30.2021.29299Palabras clave:
Palabras clave, Corpus de novelas de la Edad de Plata. Géneros literarios. Corpus. Aprendizaje automático. Estadística. Key Words, Corpus of Novels of the Spanish Silver Age. Literary genres. Corpus. Machine Learning. Statistics.Resumen
Resumen: En este artículo se presenta el Corpus de novelas de la Edad de Plata, una colección de 358 novelas publicadas por autores españoles entre 1880 y 1939. La selección de textos sigue criterios fijados por manuales de literatura. Los textos han sido codificados en XML-TEI, formato que también recoge los metadatos revisados de manera manual y las anotaciones lingüísticas realizadas por herramientas automáticas. El conjunto de datos permite realizar descripciones estadísticas, evaluar hipótesis propuestas por otros investigadores o explorar nuevas correlaciones. Finalmente, se darán descripciones semánticas de diferentes subgéneros de la novela.
Abstract: In this paper the Corpus of Novels of the Spanish Silver Age is presented, a collection of 358 novels published by Spanish authors between 1880 and 1939. The selection of the texts follows criteria from the studies of literature. The texts have been encoded in XML-TEI. In this format are also saved the manually curated metadata and the linguistic annotations by automatic tools. The data set allows calculating statistical descriptions of the novel, evaluate hypotheses by other researchers or explore new correlations. Finally, it will be presented semantic descriptions about several subgenres of the novel.