La digitalización del Diccionario Técnico de la música de Felipe Pedrell

Autores/as

DOI:

https://doi.org/10.5944/rhd.vol.9.2024.40127

Palabras clave:

Digitalización, machine learning, diccionario, musicología, humanidades digitales

Resumen

Los diccionarios del siglo XIX representan una fuente invaluable para comprender la evolución del lenguaje y la cultura de la época. Sin embargo, la digitalización de estos textos puede resultar una tarea ardua debido a la complejidad de la tipografía y la presencia de errores tipográficos. El método aplicado en estos estudios anteriores ha estado basado en la lectura de cada fuente y en el análisis del contexto de publicación. Se ha obviado la utilización de las nuevas posibilidades abiertas por las Humanidades Digitales, así como la aplicación de los resultados obtenidos para responder a las necesidades de este campo de investigación. En este artículo se describe el proceso seguido para el estudio y la digitalización del Diccionario técnico de la música de Felipe Pedrell (1894) a través de la aplicación de herramientas informáticas y de gestión de la información digitalizada. Por un lado, se han explorado plataformas de inteligencia artificial, en concreto las herramientas de machine learning Transkribus y Nanonets, con el objetivo de entrenar modelos propios de reconocimiento de escritura y transcripción.

Por otro lado, se han seguido metodologías clásicas de digitalización y reconocimiento de caracteres y se ha realizado un proceso de análisis, filtrado y tratamiento posterior a través de algoritmos que mejoran el proceso de transcripción. Finalmente, se ha desarrollado un servicio web de consulta de este diccionario que recoge los resultados de este trabajo y lo convierte en un recurso de calidad en el ámbito de la investigación musicológica y en la preservación de documentos históricos.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Bobillo, F., Gómez-Romero, J., y Araúz, P. L. (2012). Fuzzy Ontologies for Specialized Knowledge Representation in WordNet. International Conference on Information Processing and Man-agement of Uncertainty.

Cabré, M. T. (2000a). Elements for a theory of terminology: Towards an alternative paradigm. Ter-minology, 6(1), 35-57.

Cabré, M. T. (2000b). Sur la représentation mentale des concepts: bases pour une tentative de mo-délisation. En H. Béjoint y P. Thoiron (Eds.), Le sens en terminologie (pp. 20-39). Presses Uni-versitaires de Lyon.

Cabré, M. T (2001a). Consecuencias metodológicas de la propuesta teórica (I). En La terminología científico-técnica: reconocimiento, análisis y extracción de información formal y semántica (pp. 27-36). Institut Universitari de Lingüística Aplicada (Universitat Pompeu Fabra).

Cabré, M. T. (2001b). Sumario de principios que configuran la nueva propuesta teórica. En M. T. Cabré y J. Feliu (Eds.), La terminología científico-técnica: reconocimiento, análisis y extracción de información formal y semántica (pp. 17-26). Universitari de Lingüística Aplicada (Universitat Pompeu Fabra).

Cabré, M. T. (2003). Theories of terminology: their description, prescription and explanation. En M. T. Cabré, Terminology: international journal of theoretical and applied issues in specialized communication, 9(2), 163-200.

Carreras, J. J. (2001). Hijos de Pedrell: La historiografía musical española y sus orígenes naciona-listas (1780-1980). Il Saggiatore Musicale, 8(1), 121-169.

Colutto, S., Kahle, P., Guenter, H., y Muehlberger, G. Transkribus: A Platform for Automated Text Recognition and Searching of Historical Documents. En Proceedings of the 2019 15th Inter-national Conference on EScience (EScience), San Diego, CA, USA, 24-27 September 2019 (pp. 463-466).

de Schryver, G.-M., y Joffe, D. (2023). The end of lexicography, welcome to the machine: on how ChatGPT can already take over all of the dictionary maker’s tasks. http://hdl.handle.net/1854/LU-01GWSGV0M8HYZVNXV8SSZ0VXB

Faber, P, Márquez Linares, C., y Vega Expósito, M. (2005). Framing Terminology: A Process-Oriented Approach. Meta: journal des traducteurs / Meta: Translators’ Journal, 50(4).

Fellbaum, C. D., y Hicks, A. (2019). When WordNet Met Ontology. Ontology Makes Sense.

García Serrano, A. y Castellanos González, Ángel. (2017). Representación y organización de doc-umentos digitales: detalles y práctica sobre la ontología DIMH. Revista de Humanidades Dig-itales, 1, 314-344. https://doi.org/10.5944/rhd.vol.1.2017.17155

Harish, R., Raghavendra Rao, G. N. (2024). Transcription of Ancient Indian Manuscripts Through Ar-tificial Intelligence—Current Status of Technology and the Way Forward. En H. Sharma, A. Chakravorty, S. Hussain, R. Kumari (Eds.), Artificial Intelligence: Theory and Applications. AITA 2023. Lecture Notes in Networks and Systems (vol. 844). Springer. https://doi.org/10.1007/978-981-99-8479-4_2

Justiniano López, J. C. (2019). La música en la Real Academia Española, el diccionario y la institu-ción. De Autoridades al Diccionario de la lengua española de 2014. En J. Sanmartín Sáez y M. Quilis Merín (Coords.), Retos y avances en lexicografía: los diccionarios del español en el eje de la variación lingüística (pp. 187-202).

Kahle, P., Sebastian Colutto, G. H., y Muhlberger, G. (2017). ‘Transkribus – A Service Platform for Transcription, Recognition and Retrieval of Historical Documents’. En 2017 14th IAPR Interna-tional Conference on Document Analysis and Recognition (ICDAR) (pp. 19-24). IEEE. https://doi.org/10.1109/ICDAR.2017.30

Kavčič Čolić, A., y Hari, A. (2024). Improving accessibility of digitization outputs: EODOPEN project research findings. Digital Library Perspectives.

Kay, A. (2007). Tesseract: an open-source optical character recognition engine. Linux Journal, 159(2).

Li, Y., Jia, W., Shen, C., y van den Hengel, A. (2014). Characterness: An indicator of text in the wild. IEEE Transactions on Image Processing, 23(4), 1666–1677. https://doi.org/10.1109/TIP.2014.2302896

López Vallejo, M. A., y López Aguirre, R. (2021). La terminología musical en la 23.ª edición del Dic-cionario de la Lengua Española: hallazgos y desencuentros. Tonos Digital, 41, 1-34. http://hdl.handle.net/10201/11104

Mateos Frühbeck, N. (2021). Las ediciones digitales de PROLOPE: entre la edición digital y la edición digitalizada. Revista de Humanidades Digitales, 6, 236-251. https://doi.org/10.5944/rhd.vol.6.2021.3065

Mori, S., Suen, C. Y., y Yamamoto, K. (1992). Historical Review of OCR Research and Development.

Pedrell, F. (1900). Diccionario técnico de la música (2ª ed.). Isidro Torres Oriol.

Perdiki, E. (2022). Review of 'Transkribus: Reviewing HTR training on (Greek) manuscripts'. RIDE, 15. doi: 10.18716/ride.a.15.6.

Quilis Merín, M. (2019). Luisa Lacal, la primera lexicógrafa española, y su Diccionario de la músi-ca, técnico, histórico, bio-biográfico (Madrid, 1899). Revista Argentina de Historiografía Lingüística, 11(1), 47-75.

Rabus, A. (2019). Recognizing Handwritten Text in Slavic Manuscripts: A Neural-Network Approach Using Transkribus. Scripta & E-Scripta,19, 9-32.

Ronacher, A. (2024). Flask: The Python Micro Framework for Building Web Applications*. GitHub. https://github.com/pallets/flas

Rubio Amondarain, M. (2023). La disciplina musical en la lexicografía española del siglo XIX. [Trabajo de Fin de Máster. Universidad Nacional de Educación a Distancia].

Spherber G. (2018). A gentle introduction to OCR. Towards Data Science. https://towardsdatascience.com/a-gentle-introduction-to-ocr-ee1469a201a

Ströbel, P. B., Clematide, S., y Volk, M. (2020). How Much Data Do You Need? About the Creation of a Ground Truth for Black Letter and the Effectiveness of Neural OCR. En Proceedings of the 12th Language Resources and Evaluation Conference (pp. 3551–3359). European Lan-guage Resources Association. https://www.aclweb.org/anthology/2020.lrec-1.43

Subirá Puig, J. (1970). Un panorama histórico de la lexicografía musical. Anuario Musical: Revista de Musicología del CSIC, 25, 125-142.

Descargas

Publicado

2024-12-15

Cómo citar

Gallego, E., Pérez-Sevilla Pérez-Medrano, D. ., López Gómez, R., Ordiñana Gil, M., & Cascudo García-Villaraco, T. (2024). La digitalización del Diccionario Técnico de la música de Felipe Pedrell . Revista de Humanidades Digitales, 9. https://doi.org/10.5944/rhd.vol.9.2024.40127

Número

Sección

Monográfico