Próximo(s)

Evaluación asistida por inteligencia artificial generativa en prácticas de Ingeniería de Software: una prueba de concepto

Autores/as

DOI:

https://doi.org/10.5944/ried.47173

Palabras clave:

inteligencia artificial generativa, tecnología educativa, tecnologías de la información y de la comunicación, educación superior, evaluación del estudiante, ingeniería de software

Resumen

La irrupción de la inteligencia artificial generativa (GenAI) está transformando la evaluación en la educación superior y plantea desafíos específicos en asignaturas técnicas con proyectos complejos. Este trabajo presenta un asistente de evaluación basado en GenAI como prueba de concepto aplicado al hito de proyecto de la asignatura Ingeniería del Software I (Grado en Ingeniería Informática, Universidad de Salamanca). El sistema se despliega en infraestructura local y combina un pipeline multimodal para procesar memorias en PDF (incluyendo texto y diagramas de casos de uso) con un flujo de prompts alineado con la rúbrica de la asignatura. A partir de los documentos, el asistente extrae objetivos, requisitos y casos de uso; analiza su coherencia (trazabilidad e integridad); aplica la rúbrica para asignar calificaciones; y genera un informe cuantitativo y cualitativo para cada grupo. El estudio compara las notas propuestas por la IA con las otorgadas por el profesorado en 14 entregas del curso 2023-2024. Los resultados muestran una tendencia sistemática de la IA a calificar aproximadamente 1 punto por debajo de la media humana, con convergencia en algunos criterios (p. ej., requisitos no funcionales) y divergencia en otros (objetivos, casos de uso, matrices de trazabilidad), donde la IA aplica una lógica cercana a estándares profesionales. Estas diferencias resultan complementarias al juicio docente y permiten una evaluación más rica y transparente. Se discuten implicaciones éticas y pedagógicas del enfoque y se proponen líneas de trabajo futuro centradas en el refinamiento de los prompts y en la evaluación prospectiva en nuevas cohortes.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Francisco José García-Peñalvo, Universidad de Salamanca, USAL (España)

Catedrático de Informática en la USAL, recibió los premios Gloria Begué (docencia) y María de Maeztu (investigación). Coordina el Doctorado en Formación en la Sociedad del Conocimiento y es Subdirector del Instituto Universitario de Ciencias de la Educación (IUCE) de la misma universidad.

Marc Alier-Forment, Universitat Politècnica de Catalunya, UPC (España)

Profesor de la UPC, es experto en informática, e-learning e IA educativa. Doctor en Sostenibilidad y referente en Moodle con más de 190 publicaciones, dirige el doctorado en Educación en Ingeniería y es subdirector en el Instituto de Ciencias de la Educación. Es cocreador del proyecto LAMB.

Andrea Vázquez-Ingelmo, Universidad de Salamanca, USAL (España)

Profesora Ayudante Doctor e investigadora del grupo GRIAL en la Universidad de Salamanca (USAL). Doctora en Ingeniería Informática, su investigación se centra en la interacción persona-ordenador, ingeniería del software, visualización de datos y la aplicación de aprendizaje automático en sistemas educativos e interactivos.

Alicia García-Holgado, Universidad de Salamanca, USAL (España)

Profesora Titular en el Departamento de Informática y Automática de la Universidad de Salamanca (USAL) y miembro del grupo GRIAL. Coordina la Formación Transversal de la Escuela de Doctorado y es vocal de Mujer en Informática de la Sociedad Científica Informática de España (SCIE).

María José Casañ-Guerrero, Universitat Politècnica de Catalunya, UPC (España)

Ingeniera Informática y Doctora en Ciencias por la UPC. Desde 2004, es profesora e investigadora en la Facultad de Informática de la UPC. Con docencia de calidad reconocida, imparte materias sobre ingeniería de software, bases de datos y aspectos sociales y ambientales de la computación.

Juanan Pereira, Universidad del País Vasco, UPV/EHU (España)

Profesor Agregado en la UPV/EHU y Doctor en Ingeniería Informática, posee 20 años de experiencia docente. Imparte Ingeniería de Software e IA Generativa e investiga en IA educativa y código abierto. Reconocido por su excelencia docente (2016-2020), ha dirigido más de 60 proyectos y publicado diversos textos técnicos.

Citas

Alier-Forment, M., García-Peñalvo, F. J., Casañ-Guerrero, M. J., Pereira, J. A. y Llorens-Largo, F. (2024, October 8). Safe AI in Education Manifesto (Version 0.4.0). Safe AI in Education Manifesto. https://manifesto.safeaieducation.org

Alier-Forment, M., Casañ-Guerrero, M. J., Pereira, J., García-Peñalvo, F. J. y Llorens-Largo, F. (2026). Generative artificial intelligence and educational autonomy: Historical metaphors and ethical principles for pedagogical transformation. RIED: Revista Iberoamericana de Educación a Distancia, 29(1). https://doi.org/10.5944/ried.29.1.45536

Alsharefeen, R. y Al Sayari, N. (2025). Examining academic integrity policy and practice in the era of AI: A case study of faculty perspectives. Frontiers in Education, 10, Article 1621743. https://doi.org/10.3389/feduc.2025.1621743

Ashford-Rowe, K., Herrington, J. y Brown, C. (2014). Establishing the critical elements that determine authentic assessment. Assessment & Evaluation in Higher Education, 39(2), 205-222. https://doi.org/10.1080/02602938.2013.819566

Baig, M. I. y Yadegaridehkordi, E. (2025). Factors influencing academic staff satisfaction and continuous usage of generative artificial intelligence (GenAI) in higher education. International Journal of Educational Technology in Higher Education, 22(1), Article 5. https://doi.org/10.1186/s41239-025-00506-4

Bittle, K. y El-Gayar, O. (2025). Generative AI and academic integrity in higher education: A systematic review and research agenda. Information, 16(4), Article 296. https://doi.org/10.3390/info16040296

Bond, M., Khosravi, H., De Laat, M., Bergdahl, N., Negrea, V., Oxley, E., Pham, P., Chong, S. W. y Siemens, G. (2024). A meta systematic review of artificial intelligence in higher education: A call for increased ethics, collaboration, and rigour. International Journal of Educational Technology in Higher Education, 21(1), Article 4. https://doi.org/10.1186/s41239-023-00436-z

Chakraborty, T. y Masud, S. (2024). The Promethean dilemma of AI at the intersection of hallucination and creativity. Communications of the ACM, 67(10), 26-28. https://doi.org/10.1145/3652102

Chaudhry, M. A. y Kazim, E. (2022). Artificial intelligence in education (AIEd): A high-level academic and industry note 2021. AI and Ethics, 2(1), 157-165. https://doi.org/10.1007/s43681-021-00074-z

Conde, J., López-Pernas, S., Pozo, A., Munoz-Arcentales, A., Huecas, G. y Alonso, Á. (2021). Bridging the gap between academia and industry through students’ contributions to the FIWARE European open-source initiative: A pilot study. Electronics, 10(13), Article 1523. https://doi.org/10.3390/electronics10131523

Daun, M., Salmon, A., Weyer, T., Pohl, K. y Tenbergen, B. (2016). Project-based learning with examples from industry in university courses: An experience report from an undergraduate requirements engineering course. En 2016 IEEE 29th International Conference on Software Engineering Education and Training (CSEET) (pp. 184-193). https://doi.org/10.1109/CSEET.2016.15

EDSAFE AI. (2021). SAFE Benchmarks Framework. EDSAFE AI. https://www.edsafeai.org/safe

European Parliament & Council of the European Union. (2016). Regulation (EU) 2016/679 (General Data Protection Regulation). EUR-Lex. https://eur-lex.europa.eu/eli/reg/2016/679/oj/eng

European Parliament & Council of the European Union. (2024). Regulation (EU) 2024/1689 (Artificial Intelligence Act). EUR-Lex. https://eur-lex.europa.eu/eli/reg/2024/1689/oj

García-Holgado, A., García-Peñalvo, F. J. y Rodríguez-Conde, M. J. (2018). Pilot experience applying an active learning methodology in a software engineering classroom. En 2018 IEEE Global Engineering Education Conference (EDUCON) (pp. 940-947). https://doi.org/10.1109/EDUCON.2018.8363331

García-Peñalvo, F. J. (2024). Generative artificial intelligence and education: An analysis from multiple perspectives. Education in the Knowledge Society, 25, Article e31942. https://doi.org/10.14201/eks.31942

García-Peñalvo, F. J. (2025). Three scenarios for AI in education: From responsible assistance to co-creation. Education in the Knowledge Society, 26, Article e32932. https://doi.org/10.14201/eks.32932

García-Peñalvo, F. J., Alier, M., Pereira, J. y Casañ, M. J. (2024). Safe, transparent, and ethical artificial intelligence: Keys to quality sustainable education (SDG4). IJERI – International Journal of Educational Research and Innovation, (22), 1-21. https://doi.org/10.46661/ijeri.11036

García-Peñalvo, F. J., Casañ-Guerrero, M. J., Alier-Forment, M. y Pereira, J. A. (2025). The ethics of generative artificial intelligence in education under debate: A perspective from the development of a theoretical-practical case study. Revista Española de Pedagogía, 83(291), 281-293. https://doi.org/10.22550/2174-0909.4577

García-Peñalvo, F. J., García-Holgado, A., Vázquez-Ingelmo, A. y Sánchez-Prieto, J. C. (2021). Planning, communication and active methodologies: Online assessment of the software engineering subject during the COVID-19 crisis. RIED. Revista Iberoamericana de Educación a Distancia, 24(2), 41-66. https://doi.org/10.5944/ried.24.2.27689

García-Peñalvo, F. J., Llorens-Largo, F. y Vidal, J. (2024). The new reality of education in the face of advances in generative artificial intelligence. RIED: Revista Iberoamericana de Educación a Distancia, 27(1), 9-39. https://doi.org/10.5944/ried.27.1.37716

García-Peñalvo, F. J. y Vázquez-Ingelmo, A. (2023). What do we mean by GenAI? A systematic mapping of the evolution, trends, and techniques involved in generative AI. International Journal of Interactive Multimedia and Artificial Intelligence, 8(4), 7-16. https://doi.org/10.9781/ijimai.2023.07.006

Gulikers, J. T. M., Bastiaens, T. J. y Kirschner, P. A. (2004). A five-dimensional framework for authentic assessment. Educational Technology Research and Development, 52(3), 67–86. https://doi.org/10.1007/BF02504676

Ilieva, G., Yankova, T., Ruseva, M. y Kabaivanov, S. (2025). A framework for generative AI-driven assessment in higher education. Information, 16(6), Article 472. https://doi.org/10.3390/info16060472

ISO/IEC. (2023). ISO/IEC 25010:2023 Systems and software engineering — Systems and software quality requirements and evaluation (SQuaRE) — Product quality model (2nd ed.). ISO. https://www.iso.org/standard/78176.html

Jacobson, I., Booch, G. y Rumbaugh, J. (1999). The unified software development process. Addison-Wesley.

Karkoulian, S., Sayegh, N. y Sayegh, N. (2025). ChatGPT unveiled: Understanding perceptions of academic integrity in higher education—A qualitative approach. Journal of Academic Ethics, 23(3), 1171-1188. https://doi.org/10.1007/s10805-024-09543-6

Khlaif, Z. N., Ayyoub, A., Hamamra, B., Bensalem, E., Mitwally, M. A. A., Ayyoub, A., Hattab, M. K. y Shadid, F. (2024). University teachers’ views on the adoption and integration of generative AI tools for student assessment in higher education. Education Sciences, 14(10), Article 1090. https://doi.org/10.3390/educsci14101090

Leaton Gray, S., Edsall, D. y Parapadakis, D. (2025). AI-based digital cheating at university, and the case for new ethical pedagogies. Journal of Academic Ethics, 23(4), 2069-2086. https://doi.org/10.1007/s10805-025-09642-y

Mulaudzi, L. V. y Hamilton, J. (2025). Lecturer’s perspective on the role of AI in personalized learning: Benefits, challenges, and ethical considerations in higher education. Journal of Academic Ethics, 23(4), 1571-1591. https://doi.org/10.1007/s10805-025-09615-1

Mustafa, M. Y., Tlili, A., Lampropoulos, G., Huang, R., Jandrić, P., Zhao, J., Salha, S., Xu, L., Panda, S., Kinshuk, López-Pernas, S. y Saqr, M. (2024). A systematic review of literature reviews on artificial intelligence in education (AIED): A roadmap to a future research agenda. Smart Learning Environments, 11(1), Article 59. https://doi.org/10.1186/s40561-024-00350-5

Navío-Inglés, M., Guzmán Mora, J., O’Connor-Jiménez, P. y García González, A. (2025). What’s next for feedback in writing instruction? Pre-service teachers’ perceptions of assessment practices and the role of generative AI. Education Sciences, 15(11), Article 1534. https://doi.org/10.3390/educsci15111534

Qian, Y. (2025). Pedagogical applications of generative AI in higher education: A systematic review of the field. TechTrends, 69(5), 1105-1120. https://doi.org/10.1007/s11528-025-01100-1

Rumbaugh, J., Jacobson, I. y Booch, G. (2005). The unified modeling language reference manual (2nd ed.). Addison-Wesley.

Sadasivan, V. S., Kumar, A., Balasubramanian, S., Wang, W. y Feizi, S. (2023). Can AI-generated text be reliably detected? arXiv. https://doi.org/10.48550/arXiv.2303.11156

Schneider, G. y Winters, J. P. (2001). Applying use cases: A practical guide (2nd ed.). Addison-Wesley.

Selwyn, N. (2022). Education and technology: Key issues and debates (3rd ed.). Bloomsbury Academic. https://doi.org/10.5040/9781350145573

Sharma, R. C. y Panja, S. K. (2025). Addressing academic dishonesty in higher education: A systematic review of generative AI’s impact. Open Praxis, 17(2), 251-269. https://doi.org/10.55982/openpraxis.17.2.820

Tyton Partners. (2025). Time for Class 2025: Empowering educators, engaging students. Tyton Partners. https://4213961.fs1.hubspotusercontent-na1.net/hubfs/4213961/Publications/Time%20for%20Class/Tyton%20Partners_Time%20for%20Class%202025.pdf

UNESCO. (2023). Guidance for generative AI in education and research. UNESCO. https://unesdoc.unesco.org/ark:/48223/pf0000386693

Vlachopoulos, D. y Makri, A. (2024). A systematic literature review on authentic assessment in higher education: Best practices for the development of 21st century skills, and policy considerations. Studies in Educational Evaluation, 83, Article 101425. https://doi.org/10.1016/j.stueduc.2024.101425

Weber-Wulff, D., Anohina-Naumeca, A., Bjelobaba, S., Foltýnek, T., Guerrero-Dib, J., Popoola, O., Šigut, P. y Waddington, L. (2023). Testing of detection tools for AI-generated text. International Journal for Educational Integrity, 19(1), Article 26. https://doi.org/10.1007/s40979-023-00146-z

Xia, Q., Weng, X., Ouyang, F., Lin, T. J. y Chiu, T. K. F. (2024). A scoping review on how generative artificial intelligence transforms assessment in higher education. International Journal of Educational Technology in Higher Education, 21(1), 40. https://doi.org/10.1186/s41239-024-00468-z

Zhao, W. X., Zhou, K., Li, J., Tang, T., Wang, X., Hou, Y., Min, Y., Zhang, B., Zhang, J., Dong, Z., Du, Y., Yang, C., Chen, Y., Chen, Z., Jiang, J., Ren, R., Li, Y., Tang, X., Liu, Z., ... Wen, J.-R. (2023). A survey of large language models. arXiv. https://doi.org/10.48550/arXiv.2303.18223

Descargas

Publicado

13-03-2026

Cómo citar

García-Peñalvo, F. J., Alier-Forment, M., Vázquez-Ingelmo, A., García-Holgado, A., Casañ-Guerrero, M. J., & Pereira, J. (2026). Evaluación asistida por inteligencia artificial generativa en prácticas de Ingeniería de Software: una prueba de concepto. RIED-Revista Iberoamericana de Educación a Distancia, 29(2). https://doi.org/10.5944/ried.47173

Número

Sección

Monográfico

Artículos similares

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 > >> 

También puede Iniciar una búsqueda de similitud avanzada para este artículo.

Artículos más leídos del mismo autor/a