Stylometry for Geolinguistic Purposes Applied to the COSER Corpus

Authors

DOI:

https://doi.org/10.5944/rhd.vol.6.2021.30870

Keywords:

Stylometry, Geolinguistics, Stylo, Dialect Classification

Abstract

En el presente trabajo se propone la utilización de las técnicas estilométricas modernas para el estudio y clasificación de geolectos en español, realizando un análisis de Estilometría sobre el corpus COSER. Se utiliza el programa Stylo sobre una muestra de entrevistas transcritas para ex-traer parámetros fiables de categorización. Al final, se han aplicado los resultados concluyentes sobre todo el corpus, consiguiendo una clasifica-ción no aleatoria que, incluso, es explicable des-de algunos trabajos dialectales de referencia.

Downloads

Download data is not yet available.

References

Alvar López, M. (1996/2016). Andaluz. En Alvar López, M. (dir.). Manual de dialectología hispánica el español de España (pp. 245-256), Ariel.

Aurrekoetxea Olabarri, G. (2019). Sobre el valor de la dialectometría en la delimitación de las distancias lingüísticas. Glosema: Revista Asturiana de Llingüística, 1, 19-39. https://doi.org/10.1093/llc/fqt066

Calvo Tello, J. (2016). Entendiendo Delta desde las Humanidades. Caracteres: Estudios culturales y críticos de la esfera digital, 5(1), 140-176. http://revistacaracteres.net/revista/vol5n1mayo2016/entendiendo-delta/

Calvo Tello, J. (2019). Stylometric Classification of Periods and Groups of His Novels. Romanische Studien, 6, 151-163. http://www.romanischestudien.de/index.php/rst/article/view/625

Crespo Miguel, M. (2017). PRESEEA y su aporte a la creación de perfiles lingüísticos en Lingüística forense. Linred: Lingüística en la Red, 15. https://doi.org/10.1093/llc/fqt066

Cuéllar González, A. (2018). La necesidad de la validación cruzada en Stylo y cómo programarla. Caracteres: Estudios culturales y críticos de la esfera digital, 7(2), 301-320. http://revistacaracteres.net/wp-content/uploads/2018/11/Caracteresvol7n2noviembre2018-validacion.pdf

Dunn, J., Argamon, S., Rasooli, A. y Kumar, G. (2016). Profile-based authorship analysis. Digital Scholarship in the Humanities, 31(4), 689-710. https://doi.org/10.1093/llc/fqv019

Eder, M. (2015). Does size matter? Authorship attribution, small samples, big problem. Digital Scholarship in the Humanities, 30(2), 167-182. https://doi.org/10.1093/llc/fqt066

Eder, M. y Rybicki, J. (2013). Do birds of a feather really flock together, or how to choose training samples for authorship attribution. Digital Scholarship in the Humanities, 28(2), 229-236. https://doi.org/10.1093/llc/fqs036

Eder, M., Rybicki, M. y Kestemont, J. (2016). Stylometry with R: A Package for Computational Text Analysis. The R Journal, 8(1), 107-120. https://doi.org/10.32614/RJ-2016-007

Evert, S., Proisl, T., Jannidis, F., Reger, I., Pielstöm, S., Schöch, C. y Vitt, T. (2017). Understanding and explaining Delta measures for authorship attribution. Digital Scholarship in the Humanities. 32(2), ii4-ii16. https://doi.org/10.1093/llc/fqx023

Fernández-Ordoñez Hernández, I. (dir.). (2005): Corpus Oral y Sonoro del Español Rural. www.corpusrural.es

Fradejas Rueda, J.M. (2016). El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas. Caracteres: Estudios culturales y críticos de la esfera digital, 5(2), 196-245. http://revistacaracteres.net/revista/vol5n2noviembre2016/analisis-estilometrico/

García de Diego, V. (1959). Manual de dialectología española. Cultura Hispánica.

González Ollé, F. (1996/2016). Navarro. En Alvar López, M. (dir.). Manual de dialectología hispánica el español de España (pp. 305-316), Ariel.

Hernández Campoy, J.M. (1999). La geolingüística: consideraciones sobre la dimensión espacial del lenguaje. ELUA Estudios de lingüística Universidad de Alicante, 13, 65-88. http://dx.doi.org/10.14198/ELUA1999.13.03

Hernández Campoy, J.M. (2008). Principios básicos para el estudio geolingüístico de la variación. Estudios Románicos, 17(2), 515-528. https://revistas.um.es/estudiosromanicos/article/view/94981/91351

Hernández Lorenzo, L. (2019). Poesía áurea, Estilometría y fiabilidad: métodos supervisados de atribución de autoría atendiendo al tamaño de las muestras. Caracteres: Estudios culturales y críticos de la esfera digital, 8(1), 189-228. http://revistacaracteres.net/wp-content/uploads/2019/06/Caracteresvol8n1mayo2019-estilometria.pdf

Juola, P. (2009). JGAAP: A system for comparative evaluation of authorship attribution. JDHCS, 1(1). https://knowledge.uchicago.edu/record/117/files/4-173-1-PB.pdf?download=1

Julià Luna, C. (2020). Geolingüística digital: proyecto de un corpus de atlas lingüísticos. Actas III Congreso Internacional de Lingüística Computacional y de Corpus - CILCC 2020 y V Workshop en Procesamiento Automatizado de Textos y Corpus - WoPATeC 2020. Universidad de Antioquia, Medellín, 21-23 octubre de 2020. 226-229. https://cilcc20.files.wordpress.com/2020/11/libro-de-resumenes-actas-iii-cilcc-2020-y-v-wopatec-2020-virtual.pdf

Martín Zorraquino, M.A. y Fort Cañellas, M.R. (1996/2016). La frontera catalano-aragonesa. En Alvar López, M. (dir.). Manual de dialectología hispánica el español de España (pp. 293-304), Ariel.

Moreno Fernández, F. (1998/2009). Principios de sociolinguística y sociología del lenguaje. Ariel.

Moreno Fernández, F. (2003). Los estudios dialectales sobre el español en España (1979-2004). Lingüística Española Actual, 25, 1-36. https://www.researchgate.net/publication/282737387_Los_estudios_dialectales_sobre_el_espanol_de_Espana_1979-2004

Muñoz, J. (2018). De la Glotocronología a la Filogenética: estado de la cuestión y los nuevos desarrollos de la metodología de clasificación lingüística. Revista de Investigación Lingüística, 21, 170-184 https://orcid.org/0000-0002-0641-0727

Queralt, S. (2020). El uso de recursos tecnológicos en lingüística forense. Pragmalinguistica, 28, 212-237. https://orcid.org/0000-0002-0641-0727

Smith P., Aldridge W. (2011). Improving authorship attribution: Optimizing Burrows’ delta method. Journal of Quantitative Linguistics, 18, 1, 63–88. https://doi.org/10.1080/09296174.2011.533591

Stamou, C. (2008). Stylochronometry: Stylistic development, sequence of composition, and relative dating. Literary and Linguistic Computing, 23(2), 181-199. https://doi.org/10.1093/llc/fqm029

Zamora Vicente, A. (1960/1985). Dialectología española. Gredos.

Published

2021-11-26

How to Cite

Peñarrubia Navarro, P. (2021). Stylometry for Geolinguistic Purposes Applied to the COSER Corpus. Revista de Humanidades Digitales, 6, 22–42. https://doi.org/10.5944/rhd.vol.6.2021.30870

Issue

Section

Artículos Académicos