La digitalización del Diccionario Técnico de la música de Felipe Pedrell

Authors

DOI:

https://doi.org/10.5944/rhd.vol.9.2024.40127

Keywords:

Digitalización, machine learning, diccionario, musicología, humanidades digitales

Abstract

Nineteenth-century dictionaries are an invaluable resource for understanding the linguistic and cultural evolution of that period. However, digitizing these texts can be a formidable challenge due to the complexity of their typography and the prevalence of typographical errors. The methodology employed in prior studies has relied on scrutinizing each source and analyzing its publication context. The potential offered by Digital Humanities has been neglected, as well as leveraging the findings to address the demands of this research field.

This paper delineates the approach undertaken for the study and digitization of Felipe Pedrell's Technical Dictionary of Music (1894), utilizing computational tools and digital information management strategies. It explores artificial intelligence platforms, particularly machine learning tools such as Transkribus and Nanonets, aimed at training bespoke models for handwriting recognition and transcription.

Additionally, it adheres to conventional digitization and character recognition methodologies, followed by an analysis, filtering, and enhancement process using algorithms to refine the transcription procedure. Ultimately, a web-based consultation service for this dictionary has been developed, compiling the outcomes of this endeavor to provide a high-quality resource for musicological research and the preservation of historical documents.

Downloads

Download data is not yet available.

References

Bobillo, F., Gómez-Romero, J., y Araúz, P. L. (2012). Fuzzy Ontologies for Specialized Knowledge Representation in WordNet. International Conference on Information Processing and Man-agement of Uncertainty.

Cabré, M. T. (2000a). Elements for a theory of terminology: Towards an alternative paradigm. Ter-minology, 6(1), 35-57.

Cabré, M. T. (2000b). Sur la représentation mentale des concepts: bases pour une tentative de mo-délisation. En H. Béjoint y P. Thoiron (Eds.), Le sens en terminologie (pp. 20-39). Presses Uni-versitaires de Lyon.

Cabré, M. T (2001a). Consecuencias metodológicas de la propuesta teórica (I). En La terminología científico-técnica: reconocimiento, análisis y extracción de información formal y semántica (pp. 27-36). Institut Universitari de Lingüística Aplicada (Universitat Pompeu Fabra).

Cabré, M. T. (2001b). Sumario de principios que configuran la nueva propuesta teórica. En M. T. Cabré y J. Feliu (Eds.), La terminología científico-técnica: reconocimiento, análisis y extracción de información formal y semántica (pp. 17-26). Universitari de Lingüística Aplicada (Universitat Pompeu Fabra).

Cabré, M. T. (2003). Theories of terminology: their description, prescription and explanation. En M. T. Cabré, Terminology: international journal of theoretical and applied issues in specialized communication, 9(2), 163-200.

Carreras, J. J. (2001). Hijos de Pedrell: La historiografía musical española y sus orígenes naciona-listas (1780-1980). Il Saggiatore Musicale, 8(1), 121-169.

Colutto, S., Kahle, P., Guenter, H., y Muehlberger, G. Transkribus: A Platform for Automated Text Recognition and Searching of Historical Documents. En Proceedings of the 2019 15th Inter-national Conference on EScience (EScience), San Diego, CA, USA, 24-27 September 2019 (pp. 463-466).

de Schryver, G.-M., y Joffe, D. (2023). The end of lexicography, welcome to the machine: on how ChatGPT can already take over all of the dictionary maker’s tasks. http://hdl.handle.net/1854/LU-01GWSGV0M8HYZVNXV8SSZ0VXB

Faber, P, Márquez Linares, C., y Vega Expósito, M. (2005). Framing Terminology: A Process-Oriented Approach. Meta: journal des traducteurs / Meta: Translators’ Journal, 50(4).

Fellbaum, C. D., y Hicks, A. (2019). When WordNet Met Ontology. Ontology Makes Sense.

García Serrano, A. y Castellanos González, Ángel. (2017). Representación y organización de doc-umentos digitales: detalles y práctica sobre la ontología DIMH. Revista de Humanidades Dig-itales, 1, 314-344. https://doi.org/10.5944/rhd.vol.1.2017.17155

Harish, R., Raghavendra Rao, G. N. (2024). Transcription of Ancient Indian Manuscripts Through Ar-tificial Intelligence—Current Status of Technology and the Way Forward. En H. Sharma, A. Chakravorty, S. Hussain, R. Kumari (Eds.), Artificial Intelligence: Theory and Applications. AITA 2023. Lecture Notes in Networks and Systems (vol. 844). Springer. https://doi.org/10.1007/978-981-99-8479-4_2

Justiniano López, J. C. (2019). La música en la Real Academia Española, el diccionario y la institu-ción. De Autoridades al Diccionario de la lengua española de 2014. En J. Sanmartín Sáez y M. Quilis Merín (Coords.), Retos y avances en lexicografía: los diccionarios del español en el eje de la variación lingüística (pp. 187-202).

Kahle, P., Sebastian Colutto, G. H., y Muhlberger, G. (2017). ‘Transkribus – A Service Platform for Transcription, Recognition and Retrieval of Historical Documents’. En 2017 14th IAPR Interna-tional Conference on Document Analysis and Recognition (ICDAR) (pp. 19-24). IEEE. https://doi.org/10.1109/ICDAR.2017.30

Kavčič Čolić, A., y Hari, A. (2024). Improving accessibility of digitization outputs: EODOPEN project research findings. Digital Library Perspectives.

Kay, A. (2007). Tesseract: an open-source optical character recognition engine. Linux Journal, 159(2).

Li, Y., Jia, W., Shen, C., y van den Hengel, A. (2014). Characterness: An indicator of text in the wild. IEEE Transactions on Image Processing, 23(4), 1666–1677. https://doi.org/10.1109/TIP.2014.2302896

López Vallejo, M. A., y López Aguirre, R. (2021). La terminología musical en la 23.ª edición del Dic-cionario de la Lengua Española: hallazgos y desencuentros. Tonos Digital, 41, 1-34. http://hdl.handle.net/10201/11104

Mateos Frühbeck, N. (2021). Las ediciones digitales de PROLOPE: entre la edición digital y la edición digitalizada. Revista de Humanidades Digitales, 6, 236-251. https://doi.org/10.5944/rhd.vol.6.2021.3065

Mori, S., Suen, C. Y., y Yamamoto, K. (1992). Historical Review of OCR Research and Development.

Pedrell, F. (1900). Diccionario técnico de la música (2ª ed.). Isidro Torres Oriol.

Perdiki, E. (2022). Review of 'Transkribus: Reviewing HTR training on (Greek) manuscripts'. RIDE, 15. doi: 10.18716/ride.a.15.6.

Quilis Merín, M. (2019). Luisa Lacal, la primera lexicógrafa española, y su Diccionario de la músi-ca, técnico, histórico, bio-biográfico (Madrid, 1899). Revista Argentina de Historiografía Lingüística, 11(1), 47-75.

Rabus, A. (2019). Recognizing Handwritten Text in Slavic Manuscripts: A Neural-Network Approach Using Transkribus. Scripta & E-Scripta,19, 9-32.

Ronacher, A. (2024). Flask: The Python Micro Framework for Building Web Applications*. GitHub. https://github.com/pallets/flas

Rubio Amondarain, M. (2023). La disciplina musical en la lexicografía española del siglo XIX. [Trabajo de Fin de Máster. Universidad Nacional de Educación a Distancia].

Spherber G. (2018). A gentle introduction to OCR. Towards Data Science. https://towardsdatascience.com/a-gentle-introduction-to-ocr-ee1469a201a

Ströbel, P. B., Clematide, S., y Volk, M. (2020). How Much Data Do You Need? About the Creation of a Ground Truth for Black Letter and the Effectiveness of Neural OCR. En Proceedings of the 12th Language Resources and Evaluation Conference (pp. 3551–3359). European Lan-guage Resources Association. https://www.aclweb.org/anthology/2020.lrec-1.43

Subirá Puig, J. (1970). Un panorama histórico de la lexicografía musical. Anuario Musical: Revista de Musicología del CSIC, 25, 125-142.

Published

2024-12-15

How to Cite

Gallego, E., Pérez-Sevilla Pérez-Medrano, D. ., López Gómez, R., Ordiñana Gil, M., & Cascudo García-Villaraco, T. (2024). La digitalización del Diccionario Técnico de la música de Felipe Pedrell . Revista de Humanidades Digitales, 9. https://doi.org/10.5944/rhd.vol.9.2024.40127

Issue

Section

Monográfico

Similar Articles

1 2 3 4 5 6 7 8 9 10 > >> 

You may also start an advanced similarity search for this article.