La digitalización del Diccionario Técnico de la música de Felipe Pedrell
DOI:
https://doi.org/10.5944/rhd.vol.9.2024.40127Palabras clave:
Digitalización, machine learning, diccionario, musicología, humanidades digitalesResumen
Los diccionarios del siglo XIX representan una fuente invaluable para comprender la evolución del lenguaje y la cultura de la época. Sin embargo, la digitalización de estos textos puede resultar una tarea ardua debido a la complejidad de la tipografía y la presencia de errores tipográficos. El método aplicado en estos estudios anteriores ha estado basado en la lectura de cada fuente y en el análisis del contexto de publicación. Se ha obviado la utilización de las nuevas posibilidades abiertas por las Humanidades Digitales, así como la aplicación de los resultados obtenidos para responder a las necesidades de este campo de investigación. En este artículo se describe el proceso seguido para el estudio y la digitalización del Diccionario técnico de la música de Felipe Pedrell (1894) a través de la aplicación de herramientas informáticas y de gestión de la información digitalizada. Por un lado, se han explorado plataformas de inteligencia artificial, en concreto las herramientas de machine learning Transkribus y Nanonets, con el objetivo de entrenar modelos propios de reconocimiento de escritura y transcripción.
Por otro lado, se han seguido metodologías clásicas de digitalización y reconocimiento de caracteres y se ha realizado un proceso de análisis, filtrado y tratamiento posterior a través de algoritmos que mejoran el proceso de transcripción. Finalmente, se ha desarrollado un servicio web de consulta de este diccionario que recoge los resultados de este trabajo y lo convierte en un recurso de calidad en el ámbito de la investigación musicológica y en la preservación de documentos históricos.
Descargas
Citas
Bobillo, F., Gómez-Romero, J., y Araúz, P. L. (2012). Fuzzy Ontologies for Specialized Knowledge Representation in WordNet. International Conference on Information Processing and Man-agement of Uncertainty.
Cabré, M. T. (2000a). Elements for a theory of terminology: Towards an alternative paradigm. Ter-minology, 6(1), 35-57.
Cabré, M. T. (2000b). Sur la représentation mentale des concepts: bases pour une tentative de mo-délisation. En H. Béjoint y P. Thoiron (Eds.), Le sens en terminologie (pp. 20-39). Presses Uni-versitaires de Lyon.
Cabré, M. T (2001a). Consecuencias metodológicas de la propuesta teórica (I). En La terminología científico-técnica: reconocimiento, análisis y extracción de información formal y semántica (pp. 27-36). Institut Universitari de Lingüística Aplicada (Universitat Pompeu Fabra).
Cabré, M. T. (2001b). Sumario de principios que configuran la nueva propuesta teórica. En M. T. Cabré y J. Feliu (Eds.), La terminología científico-técnica: reconocimiento, análisis y extracción de información formal y semántica (pp. 17-26). Universitari de Lingüística Aplicada (Universitat Pompeu Fabra).
Cabré, M. T. (2003). Theories of terminology: their description, prescription and explanation. En M. T. Cabré, Terminology: international journal of theoretical and applied issues in specialized communication, 9(2), 163-200.
Carreras, J. J. (2001). Hijos de Pedrell: La historiografía musical española y sus orígenes naciona-listas (1780-1980). Il Saggiatore Musicale, 8(1), 121-169.
Colutto, S., Kahle, P., Guenter, H., y Muehlberger, G. Transkribus: A Platform for Automated Text Recognition and Searching of Historical Documents. En Proceedings of the 2019 15th Inter-national Conference on EScience (EScience), San Diego, CA, USA, 24-27 September 2019 (pp. 463-466).
de Schryver, G.-M., y Joffe, D. (2023). The end of lexicography, welcome to the machine: on how ChatGPT can already take over all of the dictionary maker’s tasks. http://hdl.handle.net/1854/LU-01GWSGV0M8HYZVNXV8SSZ0VXB
Faber, P, Márquez Linares, C., y Vega Expósito, M. (2005). Framing Terminology: A Process-Oriented Approach. Meta: journal des traducteurs / Meta: Translators’ Journal, 50(4).
Fellbaum, C. D., y Hicks, A. (2019). When WordNet Met Ontology. Ontology Makes Sense.
García Serrano, A. y Castellanos González, Ángel. (2017). Representación y organización de doc-umentos digitales: detalles y práctica sobre la ontología DIMH. Revista de Humanidades Dig-itales, 1, 314-344. https://doi.org/10.5944/rhd.vol.1.2017.17155
Harish, R., Raghavendra Rao, G. N. (2024). Transcription of Ancient Indian Manuscripts Through Ar-tificial Intelligence—Current Status of Technology and the Way Forward. En H. Sharma, A. Chakravorty, S. Hussain, R. Kumari (Eds.), Artificial Intelligence: Theory and Applications. AITA 2023. Lecture Notes in Networks and Systems (vol. 844). Springer. https://doi.org/10.1007/978-981-99-8479-4_2
Justiniano López, J. C. (2019). La música en la Real Academia Española, el diccionario y la institu-ción. De Autoridades al Diccionario de la lengua española de 2014. En J. Sanmartín Sáez y M. Quilis Merín (Coords.), Retos y avances en lexicografía: los diccionarios del español en el eje de la variación lingüística (pp. 187-202).
Kahle, P., Sebastian Colutto, G. H., y Muhlberger, G. (2017). ‘Transkribus – A Service Platform for Transcription, Recognition and Retrieval of Historical Documents’. En 2017 14th IAPR Interna-tional Conference on Document Analysis and Recognition (ICDAR) (pp. 19-24). IEEE. https://doi.org/10.1109/ICDAR.2017.30
Kavčič Čolić, A., y Hari, A. (2024). Improving accessibility of digitization outputs: EODOPEN project research findings. Digital Library Perspectives.
Kay, A. (2007). Tesseract: an open-source optical character recognition engine. Linux Journal, 159(2).
Li, Y., Jia, W., Shen, C., y van den Hengel, A. (2014). Characterness: An indicator of text in the wild. IEEE Transactions on Image Processing, 23(4), 1666–1677. https://doi.org/10.1109/TIP.2014.2302896
López Vallejo, M. A., y López Aguirre, R. (2021). La terminología musical en la 23.ª edición del Dic-cionario de la Lengua Española: hallazgos y desencuentros. Tonos Digital, 41, 1-34. http://hdl.handle.net/10201/11104
Mateos Frühbeck, N. (2021). Las ediciones digitales de PROLOPE: entre la edición digital y la edición digitalizada. Revista de Humanidades Digitales, 6, 236-251. https://doi.org/10.5944/rhd.vol.6.2021.3065
Mori, S., Suen, C. Y., y Yamamoto, K. (1992). Historical Review of OCR Research and Development.
Pedrell, F. (1900). Diccionario técnico de la música (2ª ed.). Isidro Torres Oriol.
Perdiki, E. (2022). Review of 'Transkribus: Reviewing HTR training on (Greek) manuscripts'. RIDE, 15. doi: 10.18716/ride.a.15.6.
Quilis Merín, M. (2019). Luisa Lacal, la primera lexicógrafa española, y su Diccionario de la músi-ca, técnico, histórico, bio-biográfico (Madrid, 1899). Revista Argentina de Historiografía Lingüística, 11(1), 47-75.
Rabus, A. (2019). Recognizing Handwritten Text in Slavic Manuscripts: A Neural-Network Approach Using Transkribus. Scripta & E-Scripta,19, 9-32.
Ronacher, A. (2024). Flask: The Python Micro Framework for Building Web Applications*. GitHub. https://github.com/pallets/flas
Rubio Amondarain, M. (2023). La disciplina musical en la lexicografía española del siglo XIX. [Trabajo de Fin de Máster. Universidad Nacional de Educación a Distancia].
Spherber G. (2018). A gentle introduction to OCR. Towards Data Science. https://towardsdatascience.com/a-gentle-introduction-to-ocr-ee1469a201a
Ströbel, P. B., Clematide, S., y Volk, M. (2020). How Much Data Do You Need? About the Creation of a Ground Truth for Black Letter and the Effectiveness of Neural OCR. En Proceedings of the 12th Language Resources and Evaluation Conference (pp. 3551–3359). European Lan-guage Resources Association. https://www.aclweb.org/anthology/2020.lrec-1.43
Subirá Puig, J. (1970). Un panorama histórico de la lexicografía musical. Anuario Musical: Revista de Musicología del CSIC, 25, 125-142.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2024 Eugenia Gallego, David Pérez-Sevilla Pérez-Medrano, Rosario López Gómez, María Ordiñana Gil, Teresa Cascudo García-Villaraco

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
Los autores que publican en esta revista están de acuerdo con los siguientes términos:
- Los artículos publicados en la revista se encuentran disponibles en acceso abierto.
- Los autores conservan los derechos de autor y garantizan a la revista el derecho de ser la primera publicación del trabajo al igual que licenciarlo bajo una Licencia Creative Commons Atribución-NoComercial 4.0 Internacional, que permite copiar y redistribuir el material en cualquier medio o formato y remezclar, transformar y construir a partir del material bajo los siguientes términos: debe dar crédito de manera adecuada, brindar un enlace a la licencia, e indicar si se han realizado cambios; no puede hacer uso del material con propósitos comerciales.
- Los autores pueden depositar el trabajo en un repositorio de preprints, postprints, establecer por separado acuerdos adicionales para la distribución no exclusiva de la versión de la obra publicada en la revista (por ejemplo, situarlo en un repositorio institucional o publicarlo en un libro), con un reconocimiento de su publicación inicial en esta revista.
- Se permite y se anima a los autores a difundir sus trabajos electrónicamente (por ejemplo, en repositorios institucionales o en su propio sitio web) antes y durante el proceso de envío, ya que puede dar lugar a intercambios productivos, así como a una citación más temprana y mayor de los trabajos publicados