Stylometry for Geolinguistic Purposes Applied to the COSER Corpus
DOI:
https://doi.org/10.5944/rhd.vol.6.2021.30870Keywords:
Stylometry, Geolinguistics, Stylo, Dialect ClassificationAbstract
En el presente trabajo se propone la utilización de las técnicas estilométricas modernas para el estudio y clasificación de geolectos en español, realizando un análisis de Estilometría sobre el corpus COSER. Se utiliza el programa Stylo sobre una muestra de entrevistas transcritas para ex-traer parámetros fiables de categorización. Al final, se han aplicado los resultados concluyentes sobre todo el corpus, consiguiendo una clasifica-ción no aleatoria que, incluso, es explicable des-de algunos trabajos dialectales de referencia.
Downloads
References
Alvar López, M. (1996/2016). Andaluz. En Alvar López, M. (dir.). Manual de dialectología hispánica el español de España (pp. 245-256), Ariel.
Aurrekoetxea Olabarri, G. (2019). Sobre el valor de la dialectometría en la delimitación de las distancias lingüísticas. Glosema: Revista Asturiana de Llingüística, 1, 19-39. https://doi.org/10.1093/llc/fqt066
Calvo Tello, J. (2016). Entendiendo Delta desde las Humanidades. Caracteres: Estudios culturales y críticos de la esfera digital, 5(1), 140-176. http://revistacaracteres.net/revista/vol5n1mayo2016/entendiendo-delta/
Calvo Tello, J. (2019). Stylometric Classification of Periods and Groups of His Novels. Romanische Studien, 6, 151-163. http://www.romanischestudien.de/index.php/rst/article/view/625
Crespo Miguel, M. (2017). PRESEEA y su aporte a la creación de perfiles lingüísticos en Lingüística forense. Linred: Lingüística en la Red, 15. https://doi.org/10.1093/llc/fqt066
Cuéllar González, A. (2018). La necesidad de la validación cruzada en Stylo y cómo programarla. Caracteres: Estudios culturales y críticos de la esfera digital, 7(2), 301-320. http://revistacaracteres.net/wp-content/uploads/2018/11/Caracteresvol7n2noviembre2018-validacion.pdf
Dunn, J., Argamon, S., Rasooli, A. y Kumar, G. (2016). Profile-based authorship analysis. Digital Scholarship in the Humanities, 31(4), 689-710. https://doi.org/10.1093/llc/fqv019
Eder, M. (2015). Does size matter? Authorship attribution, small samples, big problem. Digital Scholarship in the Humanities, 30(2), 167-182. https://doi.org/10.1093/llc/fqt066
Eder, M. y Rybicki, J. (2013). Do birds of a feather really flock together, or how to choose training samples for authorship attribution. Digital Scholarship in the Humanities, 28(2), 229-236. https://doi.org/10.1093/llc/fqs036
Eder, M., Rybicki, M. y Kestemont, J. (2016). Stylometry with R: A Package for Computational Text Analysis. The R Journal, 8(1), 107-120. https://doi.org/10.32614/RJ-2016-007
Evert, S., Proisl, T., Jannidis, F., Reger, I., Pielstöm, S., Schöch, C. y Vitt, T. (2017). Understanding and explaining Delta measures for authorship attribution. Digital Scholarship in the Humanities. 32(2), ii4-ii16. https://doi.org/10.1093/llc/fqx023
Fernández-Ordoñez Hernández, I. (dir.). (2005): Corpus Oral y Sonoro del Español Rural. www.corpusrural.es
Fradejas Rueda, J.M. (2016). El análisis estilométrico aplicado a la literatura española: las novelas policiacas e históricas. Caracteres: Estudios culturales y críticos de la esfera digital, 5(2), 196-245. http://revistacaracteres.net/revista/vol5n2noviembre2016/analisis-estilometrico/
García de Diego, V. (1959). Manual de dialectología española. Cultura Hispánica.
González Ollé, F. (1996/2016). Navarro. En Alvar López, M. (dir.). Manual de dialectología hispánica el español de España (pp. 305-316), Ariel.
Hernández Campoy, J.M. (1999). La geolingüística: consideraciones sobre la dimensión espacial del lenguaje. ELUA Estudios de lingüística Universidad de Alicante, 13, 65-88. http://dx.doi.org/10.14198/ELUA1999.13.03
Hernández Campoy, J.M. (2008). Principios básicos para el estudio geolingüístico de la variación. Estudios Románicos, 17(2), 515-528. https://revistas.um.es/estudiosromanicos/article/view/94981/91351
Hernández Lorenzo, L. (2019). Poesía áurea, Estilometría y fiabilidad: métodos supervisados de atribución de autoría atendiendo al tamaño de las muestras. Caracteres: Estudios culturales y críticos de la esfera digital, 8(1), 189-228. http://revistacaracteres.net/wp-content/uploads/2019/06/Caracteresvol8n1mayo2019-estilometria.pdf
Juola, P. (2009). JGAAP: A system for comparative evaluation of authorship attribution. JDHCS, 1(1). https://knowledge.uchicago.edu/record/117/files/4-173-1-PB.pdf?download=1
Julià Luna, C. (2020). Geolingüística digital: proyecto de un corpus de atlas lingüísticos. Actas III Congreso Internacional de Lingüística Computacional y de Corpus - CILCC 2020 y V Workshop en Procesamiento Automatizado de Textos y Corpus - WoPATeC 2020. Universidad de Antioquia, Medellín, 21-23 octubre de 2020. 226-229. https://cilcc20.files.wordpress.com/2020/11/libro-de-resumenes-actas-iii-cilcc-2020-y-v-wopatec-2020-virtual.pdf
Martín Zorraquino, M.A. y Fort Cañellas, M.R. (1996/2016). La frontera catalano-aragonesa. En Alvar López, M. (dir.). Manual de dialectología hispánica el español de España (pp. 293-304), Ariel.
Moreno Fernández, F. (1998/2009). Principios de sociolinguística y sociología del lenguaje. Ariel.
Moreno Fernández, F. (2003). Los estudios dialectales sobre el español en España (1979-2004). Lingüística Española Actual, 25, 1-36. https://www.researchgate.net/publication/282737387_Los_estudios_dialectales_sobre_el_espanol_de_Espana_1979-2004
Muñoz, J. (2018). De la Glotocronología a la Filogenética: estado de la cuestión y los nuevos desarrollos de la metodología de clasificación lingüística. Revista de Investigación Lingüística, 21, 170-184 https://orcid.org/0000-0002-0641-0727
Queralt, S. (2020). El uso de recursos tecnológicos en lingüística forense. Pragmalinguistica, 28, 212-237. https://orcid.org/0000-0002-0641-0727
Smith P., Aldridge W. (2011). Improving authorship attribution: Optimizing Burrows’ delta method. Journal of Quantitative Linguistics, 18, 1, 63–88. https://doi.org/10.1080/09296174.2011.533591
Stamou, C. (2008). Stylochronometry: Stylistic development, sequence of composition, and relative dating. Literary and Linguistic Computing, 23(2), 181-199. https://doi.org/10.1093/llc/fqm029
Zamora Vicente, A. (1960/1985). Dialectología española. Gredos.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2021 Pablo Peñarrubia Navarro

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.
RHD provides immediate free access to its content under the principle that making research available to the public for free favors greater global knowledge sharing. RHD does not charge fees to authors for the submission or processing of articles
Users can read, download, distribute, print, search, partially reproduce or link to the texts without requesting prior permission from the editor or the author.
RHD does not charge fees to authors for the processing of works, nor fees for the publication of their articles.
RHD is free from the moment of the publication of each issue and its contents are distributed with Creative Commons license No Commercial 4.0 International , which allows the user free and open access, criteria that meet the definition of open access of the Budapest Declaration in favor of open access. This means that they can be copied, used, disseminated, transmitted and exhibited publicly, provided that the authorship and the original source of their publication are cited (magazine, editorial and URL of the work, not used for commercial purposes, mention the existence and specifications of this license of use.
The authors retain the copyright and guarantee the journal the right to be the first publication of the work. The authors are free to distribute their work published in the magazine in other media, such as an institutional repository or inclusion in a book.