Evidencias de validez de las preguntas de opción múltiple diseñadas por Microsoft Bing (Copilot)

Resumen: Introducción: diseñar preguntas de opción múltiple (POM) con Microsoft Bing (Copilot) para evaluar su calidad e índices psicométricos en educación médica. Material y métodos: se diseñó un examen de 180 preguntas con Microsoft Bing. Este fue evaluado por educadores médicos en términos de re...

Full description

Saved in:
Bibliographic Details
Main Authors: Javier A. Flores-Cohaila, Ramón Ruesta-Bermejo, Carlos Gutierrez-Rios, Carlos Ramos-Godoy, Brayan Miranda-Chávez, Cesar Copaja-Corzo
Format: Article
Language:English
Published: Elsevier 2024-11-01
Series:Educación Médica
Subjects:
Online Access:http://www.sciencedirect.com/science/article/pii/S1575181324000652
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Resumen: Introducción: diseñar preguntas de opción múltiple (POM) con Microsoft Bing (Copilot) para evaluar su calidad e índices psicométricos en educación médica. Material y métodos: se diseñó un examen de 180 preguntas con Microsoft Bing. Este fue evaluado por educadores médicos en términos de relevancia y calidad de distractores. Luego, tras administrarse a estudiantes, se calcularon los índices de dificultad y discriminación. Resultados: la mayoría de preguntas fueron de alta relevancia y los distractores de alta calidad. Los índices de discriminación y dificultad de las preguntas fueron aceptables en la mayoría de preguntas. Conclusión: Microsoft Bing (Copilot) podría usarse como sustituto de ChatGPT para el diseño de POM dadas las evidencias de validez recolectadas en el estudio. Abstract: Introduction: To design multiple-choice questions (MCQs) using Microsoft Bing (Copilot) and evaluate their quality and psychometric indices in medical education. Materials and methods: A 180-question exam was designed using Microsoft Bing. It was evaluated by medical educators in terms of relevance and distractor quality. After administering the exam to students, difficulty and discrimination indices were calculated. Results: Most questions were highly relevant, and the distractors were of high quality. The discrimination and difficulty indices were acceptable for the majority of the questions. Conclusion: Microsoft Bing (Copilot) could be used as a substitute for ChatGPT in designing MCQs, given the evidence of validity collected in the study.
ISSN:1575-1813