Evaluación asistida por inteligencia artificial generativa en prácticas de Ingeniería de Software: una prueba de concepto
DOI:
https://doi.org/10.5944/ried.47173Palabras clave:
inteligencia artificial generativa, tecnología educativa, tecnologías de la información y de la comunicación, educación superior, evaluación del estudiante, ingeniería de softwareResumen
La irrupción de la inteligencia artificial generativa (GenAI) está transformando la evaluación en la educación superior y plantea desafíos específicos en asignaturas técnicas con proyectos complejos. Este trabajo presenta un asistente de evaluación basado en GenAI como prueba de concepto aplicado al hito de proyecto de la asignatura Ingeniería del Software I (Grado en Ingeniería Informática, Universidad de Salamanca). El sistema se despliega en infraestructura local y combina un pipeline multimodal para procesar memorias en PDF (incluyendo texto y diagramas de casos de uso) con un flujo de prompts alineado con la rúbrica de la asignatura. A partir de los documentos, el asistente extrae objetivos, requisitos y casos de uso; analiza su coherencia (trazabilidad e integridad); aplica la rúbrica para asignar calificaciones; y genera un informe cuantitativo y cualitativo para cada grupo. El estudio compara las notas propuestas por la IA con las otorgadas por el profesorado en 14 entregas del curso 2023-2024. Los resultados muestran una tendencia sistemática de la IA a calificar aproximadamente 1 punto por debajo de la media humana, con convergencia en algunos criterios (p. ej., requisitos no funcionales) y divergencia en otros (objetivos, casos de uso, matrices de trazabilidad), donde la IA aplica una lógica cercana a estándares profesionales. Estas diferencias resultan complementarias al juicio docente y permiten una evaluación más rica y transparente. Se discuten implicaciones éticas y pedagógicas del enfoque y se proponen líneas de trabajo futuro centradas en el refinamiento de los prompts y en la evaluación prospectiva en nuevas cohortes.
Descargas
Citas
Alier-Forment, M., García-Peñalvo, F. J., Casañ-Guerrero, M. J., Pereira, J. A. y Llorens-Largo, F. (2024, October 8). Safe AI in Education Manifesto (Version 0.4.0). Safe AI in Education Manifesto. https://manifesto.safeaieducation.org
Alier-Forment, M., Casañ-Guerrero, M. J., Pereira, J., García-Peñalvo, F. J. y Llorens-Largo, F. (2026). Generative artificial intelligence and educational autonomy: Historical metaphors and ethical principles for pedagogical transformation. RIED: Revista Iberoamericana de Educación a Distancia, 29(1). https://doi.org/10.5944/ried.29.1.45536
Alsharefeen, R. y Al Sayari, N. (2025). Examining academic integrity policy and practice in the era of AI: A case study of faculty perspectives. Frontiers in Education, 10, Article 1621743. https://doi.org/10.3389/feduc.2025.1621743
Ashford-Rowe, K., Herrington, J. y Brown, C. (2014). Establishing the critical elements that determine authentic assessment. Assessment & Evaluation in Higher Education, 39(2), 205-222. https://doi.org/10.1080/02602938.2013.819566
Baig, M. I. y Yadegaridehkordi, E. (2025). Factors influencing academic staff satisfaction and continuous usage of generative artificial intelligence (GenAI) in higher education. International Journal of Educational Technology in Higher Education, 22(1), Article 5. https://doi.org/10.1186/s41239-025-00506-4
Bittle, K. y El-Gayar, O. (2025). Generative AI and academic integrity in higher education: A systematic review and research agenda. Information, 16(4), Article 296. https://doi.org/10.3390/info16040296
Bond, M., Khosravi, H., De Laat, M., Bergdahl, N., Negrea, V., Oxley, E., Pham, P., Chong, S. W. y Siemens, G. (2024). A meta systematic review of artificial intelligence in higher education: A call for increased ethics, collaboration, and rigour. International Journal of Educational Technology in Higher Education, 21(1), Article 4. https://doi.org/10.1186/s41239-023-00436-z
Chakraborty, T. y Masud, S. (2024). The Promethean dilemma of AI at the intersection of hallucination and creativity. Communications of the ACM, 67(10), 26-28. https://doi.org/10.1145/3652102
Chaudhry, M. A. y Kazim, E. (2022). Artificial intelligence in education (AIEd): A high-level academic and industry note 2021. AI and Ethics, 2(1), 157-165. https://doi.org/10.1007/s43681-021-00074-z
Conde, J., López-Pernas, S., Pozo, A., Munoz-Arcentales, A., Huecas, G. y Alonso, Á. (2021). Bridging the gap between academia and industry through students’ contributions to the FIWARE European open-source initiative: A pilot study. Electronics, 10(13), Article 1523. https://doi.org/10.3390/electronics10131523
Daun, M., Salmon, A., Weyer, T., Pohl, K. y Tenbergen, B. (2016). Project-based learning with examples from industry in university courses: An experience report from an undergraduate requirements engineering course. En 2016 IEEE 29th International Conference on Software Engineering Education and Training (CSEET) (pp. 184-193). https://doi.org/10.1109/CSEET.2016.15
EDSAFE AI. (2021). SAFE Benchmarks Framework. EDSAFE AI. https://www.edsafeai.org/safe
European Parliament & Council of the European Union. (2016). Regulation (EU) 2016/679 (General Data Protection Regulation). EUR-Lex. https://eur-lex.europa.eu/eli/reg/2016/679/oj/eng
European Parliament & Council of the European Union. (2024). Regulation (EU) 2024/1689 (Artificial Intelligence Act). EUR-Lex. https://eur-lex.europa.eu/eli/reg/2024/1689/oj
García-Holgado, A., García-Peñalvo, F. J. y Rodríguez-Conde, M. J. (2018). Pilot experience applying an active learning methodology in a software engineering classroom. En 2018 IEEE Global Engineering Education Conference (EDUCON) (pp. 940-947). https://doi.org/10.1109/EDUCON.2018.8363331
García-Peñalvo, F. J. (2024). Generative artificial intelligence and education: An analysis from multiple perspectives. Education in the Knowledge Society, 25, Article e31942. https://doi.org/10.14201/eks.31942
García-Peñalvo, F. J. (2025). Three scenarios for AI in education: From responsible assistance to co-creation. Education in the Knowledge Society, 26, Article e32932. https://doi.org/10.14201/eks.32932
García-Peñalvo, F. J., Alier, M., Pereira, J. y Casañ, M. J. (2024). Safe, transparent, and ethical artificial intelligence: Keys to quality sustainable education (SDG4). IJERI – International Journal of Educational Research and Innovation, (22), 1-21. https://doi.org/10.46661/ijeri.11036
García-Peñalvo, F. J., Casañ-Guerrero, M. J., Alier-Forment, M. y Pereira, J. A. (2025). The ethics of generative artificial intelligence in education under debate: A perspective from the development of a theoretical-practical case study. Revista Española de Pedagogía, 83(291), 281-293. https://doi.org/10.22550/2174-0909.4577
García-Peñalvo, F. J., García-Holgado, A., Vázquez-Ingelmo, A. y Sánchez-Prieto, J. C. (2021). Planning, communication and active methodologies: Online assessment of the software engineering subject during the COVID-19 crisis. RIED. Revista Iberoamericana de Educación a Distancia, 24(2), 41-66. https://doi.org/10.5944/ried.24.2.27689
García-Peñalvo, F. J., Llorens-Largo, F. y Vidal, J. (2024). The new reality of education in the face of advances in generative artificial intelligence. RIED: Revista Iberoamericana de Educación a Distancia, 27(1), 9-39. https://doi.org/10.5944/ried.27.1.37716
García-Peñalvo, F. J. y Vázquez-Ingelmo, A. (2023). What do we mean by GenAI? A systematic mapping of the evolution, trends, and techniques involved in generative AI. International Journal of Interactive Multimedia and Artificial Intelligence, 8(4), 7-16. https://doi.org/10.9781/ijimai.2023.07.006
Gulikers, J. T. M., Bastiaens, T. J. y Kirschner, P. A. (2004). A five-dimensional framework for authentic assessment. Educational Technology Research and Development, 52(3), 67–86. https://doi.org/10.1007/BF02504676
Ilieva, G., Yankova, T., Ruseva, M. y Kabaivanov, S. (2025). A framework for generative AI-driven assessment in higher education. Information, 16(6), Article 472. https://doi.org/10.3390/info16060472
ISO/IEC. (2023). ISO/IEC 25010:2023 Systems and software engineering — Systems and software quality requirements and evaluation (SQuaRE) — Product quality model (2nd ed.). ISO. https://www.iso.org/standard/78176.html
Jacobson, I., Booch, G. y Rumbaugh, J. (1999). The unified software development process. Addison-Wesley.
Karkoulian, S., Sayegh, N. y Sayegh, N. (2025). ChatGPT unveiled: Understanding perceptions of academic integrity in higher education—A qualitative approach. Journal of Academic Ethics, 23(3), 1171-1188. https://doi.org/10.1007/s10805-024-09543-6
Khlaif, Z. N., Ayyoub, A., Hamamra, B., Bensalem, E., Mitwally, M. A. A., Ayyoub, A., Hattab, M. K. y Shadid, F. (2024). University teachers’ views on the adoption and integration of generative AI tools for student assessment in higher education. Education Sciences, 14(10), Article 1090. https://doi.org/10.3390/educsci14101090
Leaton Gray, S., Edsall, D. y Parapadakis, D. (2025). AI-based digital cheating at university, and the case for new ethical pedagogies. Journal of Academic Ethics, 23(4), 2069-2086. https://doi.org/10.1007/s10805-025-09642-y
Mulaudzi, L. V. y Hamilton, J. (2025). Lecturer’s perspective on the role of AI in personalized learning: Benefits, challenges, and ethical considerations in higher education. Journal of Academic Ethics, 23(4), 1571-1591. https://doi.org/10.1007/s10805-025-09615-1
Mustafa, M. Y., Tlili, A., Lampropoulos, G., Huang, R., Jandrić, P., Zhao, J., Salha, S., Xu, L., Panda, S., Kinshuk, López-Pernas, S. y Saqr, M. (2024). A systematic review of literature reviews on artificial intelligence in education (AIED): A roadmap to a future research agenda. Smart Learning Environments, 11(1), Article 59. https://doi.org/10.1186/s40561-024-00350-5
Navío-Inglés, M., Guzmán Mora, J., O’Connor-Jiménez, P. y García González, A. (2025). What’s next for feedback in writing instruction? Pre-service teachers’ perceptions of assessment practices and the role of generative AI. Education Sciences, 15(11), Article 1534. https://doi.org/10.3390/educsci15111534
Qian, Y. (2025). Pedagogical applications of generative AI in higher education: A systematic review of the field. TechTrends, 69(5), 1105-1120. https://doi.org/10.1007/s11528-025-01100-1
Rumbaugh, J., Jacobson, I. y Booch, G. (2005). The unified modeling language reference manual (2nd ed.). Addison-Wesley.
Sadasivan, V. S., Kumar, A., Balasubramanian, S., Wang, W. y Feizi, S. (2023). Can AI-generated text be reliably detected? arXiv. https://doi.org/10.48550/arXiv.2303.11156
Schneider, G. y Winters, J. P. (2001). Applying use cases: A practical guide (2nd ed.). Addison-Wesley.
Selwyn, N. (2022). Education and technology: Key issues and debates (3rd ed.). Bloomsbury Academic. https://doi.org/10.5040/9781350145573
Sharma, R. C. y Panja, S. K. (2025). Addressing academic dishonesty in higher education: A systematic review of generative AI’s impact. Open Praxis, 17(2), 251-269. https://doi.org/10.55982/openpraxis.17.2.820
Tyton Partners. (2025). Time for Class 2025: Empowering educators, engaging students. Tyton Partners. https://4213961.fs1.hubspotusercontent-na1.net/hubfs/4213961/Publications/Time%20for%20Class/Tyton%20Partners_Time%20for%20Class%202025.pdf
UNESCO. (2023). Guidance for generative AI in education and research. UNESCO. https://unesdoc.unesco.org/ark:/48223/pf0000386693
Vlachopoulos, D. y Makri, A. (2024). A systematic literature review on authentic assessment in higher education: Best practices for the development of 21st century skills, and policy considerations. Studies in Educational Evaluation, 83, Article 101425. https://doi.org/10.1016/j.stueduc.2024.101425
Weber-Wulff, D., Anohina-Naumeca, A., Bjelobaba, S., Foltýnek, T., Guerrero-Dib, J., Popoola, O., Šigut, P. y Waddington, L. (2023). Testing of detection tools for AI-generated text. International Journal for Educational Integrity, 19(1), Article 26. https://doi.org/10.1007/s40979-023-00146-z
Xia, Q., Weng, X., Ouyang, F., Lin, T. J. y Chiu, T. K. F. (2024). A scoping review on how generative artificial intelligence transforms assessment in higher education. International Journal of Educational Technology in Higher Education, 21(1), 40. https://doi.org/10.1186/s41239-024-00468-z
Zhao, W. X., Zhou, K., Li, J., Tang, T., Wang, X., Hou, Y., Min, Y., Zhang, B., Zhang, J., Dong, Z., Du, Y., Yang, C., Chen, Y., Chen, Z., Jiang, J., Ren, R., Li, Y., Tang, X., Liu, Z., ... Wen, J.-R. (2023). A survey of large language models. arXiv. https://doi.org/10.48550/arXiv.2303.18223
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Derechos de autor 2026 Francisco José García-Peñalvo, Marc Alier-Forment, Andrea Vázquez-Ingelmo, Alicia García-Holgado, María José Casañ-Guerrero, Juanan Pereira

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
Las obras que se publican en esta revista están sujetos a los siguientes términos:
1. Los autores ceden de forma no exclusiva los derechos de explotación de los trabajos aceptados para su publicación en "RIED. Revista Iberoamericana de Educación a Distancia," y garantizan a la revista el derecho a ser la primera en publicar ese trabajo, igualmente, permiten a la revista distribuir obras publicadas bajo la licencia indicada en el punto 2.
2. Las obras se publican en la edición electrónica de la revista bajo una licencia Creative Commons Reconocimiento 4.0 Internacional (CC BY 4.0). Se permite copiar y redistribuir el material en cualquier medio o formato, adaptar, remezclar, transformar y crear a partir del material para cualquier finalidad, incluso comercial. Debe reconocer adecuadamente la autoría, proporcionar un enlace a la licencia e indicar si se han realizado cambios.
3. Condiciones de auto-archivo. Se permite e incentiva a los autores a difundir electrónicamente la versión OnlineFirst (versión evaluada y aceptada para su publicación) de su obra antes de su publicación definitiva, siempre con referencia a su publicación en RIED, ya que favorece su circulación y difusión antes y así propiciar un posible aumento de su citación y alcance entre la comunidad académica. Color RoMEO: verde.


