Estilometría con fines geolingüísticos aplicada al corpus COSER

Autores/as

DOI:

https://doi.org/10.5944/rhd.vol.6.2021.30870

Palabras clave:

Estilometría, geolingüística, stylo, Clasificación dialectal, PLN

Resumen

En el presente trabajo se propone la utilización de las técnicas estilométricas modernas para el estudio y clasificación de geolectos en español, realizando un análisis de Estilometría sobre el corpus COSER. Se utiliza el programa Stylo sobre varias entrevistas transcritas para extraer parámetros fiables de categorización. Al final, se han aplicado los resultados concluyentes sobre todo el corpus, consiguiendo una clasificación no aleatoria que, incluso, es explicable desde algunos trabajos dialectales de referencia.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Alvar López, M. (1996/2016). Andaluz. En Alvar López, M. (dir.). Manual de dialectología hispánica el español de España (pp. 245-256), Ariel.

Aurrekoetxea Olabarri, G. (2019). Sobre el valor de la dialectometría en la delimitación de las distancias lingüísticas. Glosema: Revista Asturiana de Llingüística, 1, 19-39. https://doi.org/10.1093/llc/fqt066

Calvo Tello, J. (2016). Entendiendo Delta desde las Humanidades. Caracteres: Estudios culturales y críticos de la esfera digital, 5(1), 140-176. http://revistacaracteres.net/revista/vol5n1mayo2016/entendiendo-delta/

Calvo Tello, J. (2019). Stylometric Classification of Periods and Groups of His Novels. Romanische Studien, 6, 151-163. http://www.romanischestudien.de/index.php/rst/article/view/625

Crespo Miguel, M. (2017). PRESEEA y su aporte a la creación de perfiles lingüísticos en Lingüística forense. Linred: Lingüística en la Red, 15. https://doi.org/10.1093/llc/fqt066

Cuéllar González, A. (2018). La necesidad de la validación cruzada en Stylo y cómo programarla. Caracteres: Estudios culturales y críticos de la esfera digital, 7(2), 301-320. http://revistacaracteres.net/wp-content/uploads/2018/11/Caracteresvol7n2noviembre2018-validacion.pdf

Dunn, J., Argamon, S., Rasooli, A. y Kumar, G. (2016). Profile-based authorship analysis. Digital Scholarship in the Humanities, 31(4), 689-710. https://doi.org/10.1093/llc/fqv019

Eder, M. (2015). Does size matter? Authorship attribution, small samples, big problem. Digital Scholarship in the Humanities, 30(2), 167-182. https://doi.org/10.1093/llc/fqt066

Eder, M. y Rybicki, J. (2013). Do birds of a feather really flock together, or how to choose training samples for authorship attribution. Digital Scholarship in the Humanities, 28(2), 229-236. https://doi.org/10.1093/llc/fqs036

Eder, M., Rybicki, M. y Kestemont, J. (2016). Stylometry with R: A Package for Computational Text Analysis. The R Journal, 8(1), 107-120. https://doi.org/10.32614/RJ-2016-007

Evert, S., Proisl, T., Jannidis, F., Reger, I., Pielstöm, S., Schöch, C. y Vitt, T. (2017). Understanding and explaining Delta measures for authorship attribution. Digital Scholarship in the Humanities. 32(2), ii4-ii16. https://doi.org/10.1093/llc/fqx023

Fernández-Ordoñez Hernández, I. (dir.). (2005): Corpus Oral y Sonoro del Español Rural. www.corpusrural.es

Fradejas Rueda, J.M. (2016). El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas. Caracteres: Estudios culturales y críticos de la esfera digital, 5(2), 196-245. http://revistacaracteres.net/revista/vol5n2noviembre2016/analisis-estilometrico/

García de Diego, V. (1959). Manual de dialectología española. Cultura Hispánica.

González Ollé, F. (1996/2016). Navarro. En Alvar López, M. (dir.). Manual de dialectología hispánica el español de España (pp. 305-316), Ariel.

Hernández Campoy, J.M. (1999). La geolingüística: consideraciones sobre la dimensión espacial del lenguaje. ELUA Estudios de lingüística Universidad de Alicante, 13, 65-88. http://dx.doi.org/10.14198/ELUA1999.13.03

Hernández Campoy, J.M. (2008). Principios básicos para el estudio geolingüístico de la variación. Estudios Románicos, 17(2), 515-528. https://revistas.um.es/estudiosromanicos/article/view/94981/91351

Hernández Lorenzo, L. (2019). Poesía áurea, Estilometría y fiabilidad: métodos supervisados de atribución de autoría atendiendo al tamaño de las muestras. Caracteres: Estudios culturales y críticos de la esfera digital, 8(1), 189-228. http://revistacaracteres.net/wp-content/uploads/2019/06/Caracteresvol8n1mayo2019-estilometria.pdf

Juola, P. (2009). JGAAP: A system for comparative evaluation of authorship attribution. JDHCS, 1(1). https://knowledge.uchicago.edu/record/117/files/4-173-1-PB.pdf?download=1

Julià Luna, C. (2020). Geolingüística digital: proyecto de un corpus de atlas lingüísticos. Actas III Congreso Internacional de Lingüística Computacional y de Corpus - CILCC 2020 y V Workshop en Procesamiento Automatizado de Textos y Corpus - WoPATeC 2020. Universidad de Antioquia, Medellín, 21-23 octubre de 2020. 226-229. https://cilcc20.files.wordpress.com/2020/11/libro-de-resumenes-actas-iii-cilcc-2020-y-v-wopatec-2020-virtual.pdf

Martín Zorraquino, M.A. y Fort Cañellas, M.R. (1996/2016). La frontera catalano-aragonesa. En Alvar López, M. (dir.). Manual de dialectología hispánica el español de España (pp. 293-304), Ariel.

Moreno Fernández, F. (1998/2009). Principios de sociolinguística y sociología del lenguaje. Ariel.

Moreno Fernández, F. (2003). Los estudios dialectales sobre el español en España (1979-2004). Lingüística Española Actual, 25, 1-36. https://www.researchgate.net/publication/282737387_Los_estudios_dialectales_sobre_el_espanol_de_Espana_1979-2004

Muñoz, J. (2018). De la Glotocronología a la Filogenética: estado de la cuestión y los nuevos desarrollos de la metodología de clasificación lingüística. Revista de Investigación Lingüística, 21, 170-184 https://orcid.org/0000-0002-0641-0727

Queralt, S. (2020). El uso de recursos tecnológicos en lingüística forense. Pragmalinguistica, 28, 212-237. https://orcid.org/0000-0002-0641-0727

Smith P., Aldridge W. (2011). Improving authorship attribution: Optimizing Burrows’ delta method. Journal of Quantitative Linguistics, 18, 1, 63–88. https://doi.org/10.1080/09296174.2011.533591

Stamou, C. (2008). Stylochronometry: Stylistic development, sequence of composition, and relative dating. Literary and Linguistic Computing, 23(2), 181-199. https://doi.org/10.1093/llc/fqm029

Zamora Vicente, A. (1960/1985). Dialectología española. Gredos.

Descargas

Publicado

2021-11-26

Cómo citar

Peñarrubia Navarro, P. (2021). Estilometría con fines geolingüísticos aplicada al corpus COSER. Revista de Humanidades Digitales, 6, 22–42. https://doi.org/10.5944/rhd.vol.6.2021.30870

Número

Sección

Artículos Académicos