Breve historia del por qué evaluamos en la escuela y algunas idea del cómo deberíamos evaluar en la era de la IA.
¿Cómo evitar seguir repitiendo una historia de evaluaciones que muchas veces no tienen una intención ni claridad del porque se aplican?
La evaluación surge con una intención evidentemente práctica. Los primeros homínidos se evaluaban a sí mismos y evaluaban a otros 50.000 años atrás.
A lo largo de la historia humana, la evaluación ha sido esencial, tanto en los sistemas educativos, como en general en las culturas, desde los tiempos en que maestros y estudiantes discutían en espacios comunes en la antigua Grecia, o se preparaban para hacer parte del estado en la antigua China hasta el desarrollo de complejos exámenes estandarizados y uso de infinitas herramientas en la actualidad.
Su propósito ha evolucionado de una simple medida de conocimiento a una herramienta para entender habilidades, creatividad y competencias. Ahora, en la era de la inteligencia artificial (IA), los métodos de evaluación enfrentan una transformación aún más profunda. ¿Cómo podemos utilizar la IA para evaluar de manera justa y efectiva? Y, al mismo tiempo, ¿Cómo asegurarnos de que las evaluaciones sean éticas y transparentes? ¿Cómo usar la IA a nuestro favor evitando que ella nos use?
Breve historia de la evaluación escolar:
- Evaluación en las primeras sociedades antiguas. ¿Cómo saber que algo es bueno o qué se está ejecutando de forma adecuada? Habría que pensar en la intención, el para qué. Si imaginamos a los primeros homínidos que podían juzgar lo que otros hacían, su mirada era eminentemente práctica, ¿funciona o no funciona? Si lo que hacía su par funcionaba y lograba el objetivo es porque estaba bien hecho. Si lo que él mismo hacía funcionaba (metacognición) es porque estaba bien hecho. Este simple ejercicio en pro de lo útil marcaría el comienzo de la evaluación. Sabemos cazar, sabemos cosechar, sabemos protegernos, todo el conocimiento y su puesta en práctica era evidentemente práctico, solucionaba un problema. No pierdas esto de vista.
- En la China de hace 1.600 años a.c, es donde se tiene el registro de las primeras evaluaciones escolares (Dubois 1970), para ser exacto, en la Dinastía Shang, donde miles futuros soldados, agricultores y personas del común esperaban hacerse funcionarios y parte del servicio civil. ¿Qué les preguntaban? Cosas prácticas y útiles, mejor tiempo para sembrar una cosecha o cualidades técnicas positivas de un soldado.
- A inicios de la Edad Media Europea, año 300d.c incluían en las evaluaciones la creación de un poema con tintes nacionalistas y la hermenéutica de los pasajes de Confucio. La evaluación al igual que la escuela proyectaba intenciones políticas. Lo útil podría estar mutando.
- En la Antigua Grecia, año 400a.c, los filósofos y maestros evaluaban a través del diálogo y la observación. Se valoraba el pensamiento crítico y la capacidad de argumentar. En muchos casos el pedagogo era un esclavo que acompañando a su amo, aprendía las lecciones y se las hacía repetir de camino a casa.
- Los Griegos definieron que lo que se debía enseñar era lo mejor de la cultura, ¿qué es lo mejor? El discurso dominante de las ciencias, las artes, las letras, a eso le llamaron “La Paideía” y debemos hacer dos aclaraciones: Primero. No se dice “Pai-deia” estos diptongos suenan a “pedía”. Segundo, si bien hay miles de obras al respecto sobre la Paideía, un griego de forma simple diría: “Paideía son los valores propios de nuestra cultura”. Los griegos y los romanos tenían una simple premisa entre manos, enseñemos lo mejor y más representativo de la cultura, el humanismo.
- En la Edad Media Europea, cuando surgen las universidades en el continente en el año 1.100dc, eran bastante clasistas y elitistas, definían según sus oscuros criterios quien podía ingresar. Los programas convencionales eran Derecho, Medicina y una amalgama de Filosofía con Teología que no fuese en contra de las creencias. Recordemos que la mayoría de las personas o casi todas no sabían leer en las primeras civilizaciones Chinas o Sumerias, no sabían leer en la antigua Grecia, menos en la Edad Media Europea. ¿El resultado de esta educación? Un extraño conjunto de ficciones religiosas, ciencia centrada en creencias populares, filosofía al servicio de la fe y solo una pizca de razón suficiente para hacerlas progresar. La razón como luz en la oscuridad.
- Y llegó la era de la estandarización, con el auge de las universidades y las escuelas en la Edad Moderna, surgieron exámenes formales, ayudando a estructurar y medir conocimientos específicos de manera uniforme. La época Victoriana de la mano de la Revolución Industrial, llevó a miles de campesinos a las grandes ciudades, era una educación útil al servicio de la empresa incipiente de la época, pero además se enseñaba toda una amalgama de cosas que pasaba por los autores clásicos europeos (es particular que casi siempre cuando pensamos en los clásicos nos centramos en Europa, ¿cuántos clásicos se leían de otro continentes?, muy pocos), ideas filosóficas blanqueadas desde la catequesis que no fueran muy lejos de lo que se quería escuchar. Los profesores cansados de tener clases con 40, 50 o más estudiantes inventaron una formula sencilla para evaluar. Colocar una nota, los primeros registros de esta práctica tienen un cierto consenso en que su creador fue William Farish (1759–1837). 200 años después replicamos la historia. En esta misma época se crean los grados escolares, otrora se trataba de que el estudiante alcanzara un conjunto de aprendizajes, no importaba tanto la edad. Luego, con los grados escolares, las cosas cambiaron. Todos lo sabemos, los grados escolares no dicen tanto de los niveles cognitivos y de aprendizaje de los estudiantes como quisiéramos. ¿Por qué seguimos colocando notas? ¿por qué aún existen los grados escolares?
- Iniciando el siglo XX las primeras ideas de psicometría impulsadas por Alfred Binet tenían una pregunta en mente, ¡evaluemos el nivel cognitivo de los estudiantes! era la premisa, con un pequeño cambio más que anecdótico, la pregunta no era ¿Quién es el más inteligente? Sino ¿Quién es el mas bruto? Ante la imposibilidad de responder, además del rotulo negativo, se crearon los test y las herramientas para medir el Coeficiente Intelectual CI. “Es posible poner techo al grado de inteligencia, no al grado de idiotez”, fue una de las conclusiones más relevantes. Suena esto sencillo y correcto pero durante décadas estos rótulos sirvieron para argumentar que los inmigrantes eran débiles mentalmente, a esta conclusión llegó Goddard en 1912. Y previamente la craneometría impulsada por Samuel George Morton defendía la tesis de la superioridad de los caucásicos sobre los negros, al tener estos primeros supuestamente un cerebro más grande. Datos aleatorios mal usados sirven para crear segregación a niveles inesperados. Nada diferente de lo que pasa en la actualidad, muchos aún creen que en un país la gente es más inteligente que en otro.
- En la segunda mitad del siglo XX: Los sistemas educativos en diversas partes del mundo adoptaron pruebas estandarizadas para evaluar conocimientos de grandes poblaciones de estudiantes. Esto trajo ventajas en términos de medición, pero también redujo la flexibilidad para valorar otros aspectos importantes del aprendizaje, como la creatividad y la resolución de problemas. Las noticias a nivel global sobre los mejores y peores sistemas educativos no se hicieron esperar. Los gobiernos muchas veces sin reparos técnicos de las complejidades de los resultados de las evaluaciones lanzaron alertas sobre los sistemas y modelos educativos. ¡La educación está en decadencia! Primera regla de la buena evaluación usar bien los datos.
- El siglo XXI y el impacto de la tecnología: A medida que la tecnología avanzó, la evaluación se diversificó para incluir métodos como la evaluación continua, la autoevaluación, mecanismos de evaluación Para el aprendizaje y el uso de plataformas en línea.
- La era de la IA: Hoy, la IA permite personalizar las evaluaciones y analizar grandes cantidades de datos para ofrecer retroalimentación precisa y en tiempo real con un sin número de herramientas que sin exagerar aparecen todos los días.
¿Cómo Evaluar en la Era de la IA?
Nuestra consigna es que no podemos hacer nada con el pasado, pero si podemos ver hacia el presente y futuro. Solo tiene sentido el estudio del pasado con la finalidad de establecer puntos de encuentro en la actualidad que permitan reflexionar y cambiar paradigmas, destrozar creencias innecesarias.
En este ultra breve resumen de la historia de la educación podemos encontrar unos puntos que merecen la pena una reflexión más detallada. 1. Esencialmente la educación y la evaluación tenían en su origen un carácter eminente práctico. ¿Para qué aprendo lo que aprendo? Para saber cultivar, usar una herramienta, razonar, tener pensamiento crítico. Luego la educación y la evaluación van migrando a ideas más oscuras, por ejemplo enseñar de religión para evangelizar, o enseñar de política para adoctrinar. ¿Qué sentido práctico tiene esto? O ¿qué sentido tiene enseñar sobre ideas nacionalistas que sirvan de apoyo para la expansión del estado?
Pensando fuera de la caja, la educación solo debería tener una finalidad, desarrollar el potencial intelectual del ser humano. Enseñar a memorizar con unos oscuros objetivos tiene solo sentido para los que se benefician de ello. Y si los docentes seguimos haciendo lo mismo sin pensarlo mucho, somos cómplices.
Bien expresaba Gabo “Desde muy niño tuve que interrumpir mi educación para ir a la escuela”.
Los alemanes en el siglo XVIII echaron mano de un concepto similar a Paideía, en este caso era Bildung, sin una traducción exacta al español en el contexto educativo, también hace referencia al nivel educativo, a enseñar lo mejor, lo más representativo de la cultura, de la cultura alemana claro está. La Escuela de Frankfurt en el siglo XX definió este concepto como, emancipador y liberador.
La pregunta sería, ¿un concepto libera y emancipa? Sea Bildung o Paideía, ¿van a liberarnos? Recuerdo leer en la universidad hasta la saciedad sobre estos conceptos, las clases versaron en muchos sentidos sobre su apropiación, escribimos ensayos sobre autores que hablaban de ellos, creamos relaciones, reflexiones.
Perdí mi tiempo siendo franco, al igual que lo pierden la mayoría de los estudiantes que asisten a estas clases. El concepto ni libera, ni enseña, el concepto te da elementos para pensar, pero es la práctica, la puesta en escena la que sirve para proponer y evitar repetir hasta la saciedad lo mismo.
Veamos esto más despacio antes de que abandones esta lectura. Estudiar profundamente el pasado puede servir para generar una mirada más amplia de las cosas, para posiblemente entender mejor lo que pasa hoy en día, y en ese sentido. ¿Si cambiamos nuestra mirada de la enseñanza de los conceptos y nos concentramos en solucionar los problemas actuales de la escuela y la evaluación? ¿Sí le ayudamos a los estudiantes a solucionar sus propios problemas sin tanta palabrería? Enseñemos con sentido. Y que los estudiantes aprendan con sentido. A eso me refiero, solucionemos problemas reales.
Por ejemplo, cuando le hemos preguntado a los docentes porque enseñan lo que enseñan tanto en la escuela como en la universidad, las respuestas van desde “es lo que pide el MEN” “es importante” o “algún día le servirá al estudiante” y algunos más honestos “es lo que me pusieron a dar”… todas estas respuesta son bastante endebles, el modelo educativo es bastante amplio y liberal en Colombia, no existe eso de currículo único, el MEN aboga por el desarrollo de competencias, los conceptos son el puente para el desarrollo de habilidades, si bien son necesarios, si no sabemos poner en práctica, no aprendemos realmente. Y en las universidades existe plena autonomía y libertad de cátedra.
Saber es la habilidad de poner algo en práctica, y que ese algo te pueda servir para solucionar un problema práctico. No me sirve nada lo que no pueda poner en práctica ya o al menos en el presente cercano. A quien dice “te enseño para el tu futuro” respóndele “¿Y usted sabe cómo será el futuro?
Podré decir algo aún más chocante, enseñamos algo porque eso nos da de que comer. Y no está mal, es imposible pelear contra el hambre, pero, si de esas clases sin sentido construyo sentido en los estudiantes, ayudaremos realmente y de mejor manera.
Enseñamos las ciencias clásicas sin pensar mucho en ello, ¿de qué me sirven estos conceptos que aún se aprenden en el colegio de física newtoniana, muchos de ellos 100% revalidados? ¿De qué me sirve aprender la teoría de la evolución cuando se está redefiniendo? ¿Qué tendré que usar más mañana por la mañana, la historia de Napoleón o mis habilidades para leer las buenas o malas intenciones de las personas que me rodean? Enseñemos competencias evidentemente prácticas para el día a día.
“Dicto clase”, “doy clase”, son expresiones nefastas, pobres chicos, van a que les den algo, ellos no piensan, ni reflexionan, son alumnos…
La historia demuestra que la educación ha servido en gran parte para expandir mitos y creencias ilógicas, así que vamos a procurar no repetir esos errores y busquemos mejor como eliminar mitos sin sentido. Busquemos los mecanismos para crear pensamiento crítico.
¿Por qué evaluamos tal como evaluamos?
Ya hemos brindado algunas respuestas, evaluamos así por seguir un modelo que se planteó un par de siglos atrás. Evaluamos así porque es difícil cambiar el modelo establecido o evaluamos así porque reflexionamos poco sobre las causas y consecuencias de este modelo. Podemos ser en parte pesimistas y optimistas, así que vamos por partes:
Siendo pesimistas, evaluamos así porque nos falta reflexión profunda. Para dar un contexto en Colombia se reglamentó gracias al decreto 1290 de 2009 que cada establecimiento educativo determinará los criterios de promoción escolar de acuerdo con el sistema institucional de evaluación con plena autonomía. En otras palabras, las escuelas y colegios pueden definir su modelo de evaluación con plena libertad, siempre y cuando se respeten elementos claves de cualquier proceso evaluativo: Qué sea un proceso claro, objetivo, informado y contextualizado a las realidades curriculares.
En general en Colombia se usan históricamente 4 periodos en el año lectivo, se usan notas de 0 a 5, y se aprueba con 3. ¿Con esta posibilidad los colegios y escuelas hicieron grandes cambios?, como ¿dejar tres periodos o usar mejor cinco?, o ¿en vez de usar números usar letras?, o ¿en vez de evaluaciones, procesos de evidencias de aprendizajes basados en proyectos?… son infinitas las posibilidades. Pero en general la gran mayoría de las instituciones no plasmaron grandes cambios. Solo basta con revisar que la producción intelectual al respecto es mínima y que si se revisan los modelos de evaluación de escuela y colegios para revisar esos cambios profundos, fueron casi inexistentes.
Siendo optimistas, la internet y claro la IA si están revolucionando los modelos de evaluación, ya no basta con la simple tarea que debe presentar el estudiante, ahora el docente debe buscar los mecanismo para evitar que la IA la haga por el estudiante. Esto generó un simple pero profundo proceso de cambio. ¿Es necesario aún el cuaderno y más aún calificarlo cuando se tiene a la mano mejor información? ¿Para qué las tareas? ¿Qué sentido tiene realmente evaluar? Y ¿cómo podemos resignificar la evaluación? Es un tema que vamos a discutir con más profundidad en las siguientes editoriales, y porque no, un libro en el que amplíe todo esto.
De forma simple, cambiar el proceso de evaluación, obliga a cambiar el proceso de enseñanza y cambiar que se debe enseñar.
Y ¿las evaluaciones censales y estandarizadas para qué sirven?
Las evaluaciones censales y estandarizadas tienen unas implicaciones prácticas bastante positivas cuando se usan con intenciones adecuadas. Así como cualquier cosa que enseñamos, si tiene un sentido claro, una intención precisa y un fin justo. Volvamos al relato del COVID, ¿de qué servía que nos practicaran la prueba? En esencia la prueba del COVID es un examen ¿lo habías pensado así? Es una prueba para obtener información, y eso es a evaluación, “obtener información sobre el proceso de aprendizaje de un estudiante”, Mac Millan.
¿Y para qué saber si estábamos infectados?, para tomar precauciones, para cuidarnos, para no ponernos en riesgo, ni a nosotros, ni a otros. El mero indicador del COVID sin un sentido práctico de toma de decisiones sirve de poco.
Y en este caso cuando se liberan los resultados de las evaluaciones estandarizadas ¿De qué sirve que se hable de los bajos niveles de lectura y pensamiento crítico en la mayoría de los países del mundo? Sirve, como diagnóstico para establecer soluciones, leemos mal, ¡enseñemos a leer mejor! evitando perpetuar los mismos ejercicios y libros de toda la vida. ¡Si no funcionan pues cámbialos!. Establezcamos ejercicios de lectura consciente. Analicemos casos, hagamos algo que realmente sirva. Aprendamos leer y a pensar críticamente. Pongamos en práctica las ideas.
Si los resultados de cualquier prueba se toman solo como una noticia o titular más en la prensa, no hay sentido. Pero si gracias a ello cambiamos las prácticas en el ámbito educativo, eso sí tiene sentido. Esto implica trabajar por proyectos, similar a esos docentes como Luis Migue Bermudez que han logrado bajar en varios dígitos los niveles de embarazos no deseados, enseñar de sexualidad debe tener un fin evidentemente práctico. Recuerda, lo que enseñas que ayuda a solucionar.
Si con estos resultados ponemos en la agenda de las escuelas y las universidades estrategias prácticas para el desarrollo de competencias, allí la evaluación tiene sentido. Evaluar tiene sentido en la medida en la que ponemos en marcha acciones para mejorar el aprendizaje. Por eso hay instituciones y docentes que hacen un trabajo espectacular, revisan resultados y proponen cambios. ¿Te has preguntado porque hay escuela, colegios y universidad con tan buenos niveles y excelentes prácticas? Acá está parte de la respuesta, toman decisiones con los datos y evitan hacer lo mismo de siempre.
Y , ¿será que cambiaremos la historia de la evaluación gracias a la IA?
En esta época turbulenta para aprovechar la IA y su potencial en las evaluaciones, es fundamental que los educadores y las instituciones adapten sus enfoques. Aquí presentamos algunas recomendaciones clave:
- Combinar la IA con el juicio y el criterio humano.
Aunque la IA ofrece un gran potencial en la evaluación, el juicio crítico humano sigue siendo esencial, especialmente en áreas complejas como la ética, la creatividad y el pensamiento complejo. Una combinación de estos ámbitos puede ofrecer una evaluación más completa. Usemos rúbricas que evalúan elementos de creatividad, Guilford es una excelente referencia. - Aprovechar la personalización y adaptabilidad permanente:
La IA permite que las evaluaciones se adapten en tiempo real a las necesidades de cada estudiante. Usar plataformas, gran parte de ellas gratuitas, que analicen el rendimiento y ajusten las preguntas según el nivel de comprensión puede ayudar a los estudiantes a aprender a su propio ritmo y en su estilo. Sorprende como podemos pedirle a los estudiantes que discutan contra la IA, que busquen sus puntos flacos. No les pidas que repitan y memoricen, enséñales sus falsedades, sus propias falacias. - Enfoque en la evaluación formativa o Para el Aprendizaje:
Las evaluaciones formativas o Para del Aprendizaje, que se realizan de manera continua, pueden beneficiarse enormemente de la IA, proporcionando retroalimentación instantánea y ayudando a los estudiantes a mejorar gradualmente. La IA permite crear perfiles de aprendizaje para dar recomendaciones personalizadas y ayudar a cerrar brechas de conocimiento. Recuerda que para el 2025 la IA se convertirá en agentes que prácticamente te van a ayudar a solucionar todo. Usa la IA para aprender de ti mismo. Para que tus estudiantes se descubran. - Fomentar la ética y la transparencia, estudios de caso:
Es fundamental que los estudiantes entiendan cómo se usa la IA en su evaluación y qué datos se recopilan. Mantener un enfoque ético y transparente, informando sobre el proceso de análisis y los criterios utilizados, refuerza la confianza en las evaluaciones basadas en IA. Ponles casos de situaciones reales, que los toquen, ¿por qué ser fiel? ¿por qué ser vegano? Incluye situaciones con tensiones éticas. ¡Escúchalos! ¿cuáles son sus propios problemas y enigmas? Olvida por un rato la clase tradicional y céntrate en ellos. - Utilizar la IA para evaluar habilidades prácticas para la vida:
En todas las áreas la IA permite crear entornos simulados donde los estudiantes pueden aplicar lo aprendido y recibir retroalimentación de inmediato. Ponlos a competir contra la IA. ¿Quién soluciona mejor los problemas? Amo una frase que leí hace poco 1 + 1= 3, una idea, más otra idea, crea una nueva idea. - Incorporar la autoevaluación y el feedback colaborativo:
La IA puede facilitar herramientas para la autoevaluación y el feedback entre pares. Estas prácticas fomentan la autorreflexión y ayudan a los estudiantes a ver sus avances y áreas de mejora desde diferentes perspectivas. Trabaja un mismo texto durante todo el periodo o semestre, ayúdale a que se autoevalúe, guarda ese texto y deja que la propia reflexión haga lo suyo cuando al final les demuestres como han mejorado. - Evitar la dependencia total de la IA:
Aunque la IA es una herramienta poderosa, es importante no depender exclusivamente de ella. La evaluación humana sigue siendo crucial para asegurar una perspectiva integral, especialmente en temas complejos. Invita a la discusión sin usar el celular, pon en juego dinámicas que ayuden a delimitar esa dependencia en la que todos en mayor o menor medida hemos caído.
Para concluir, podemos decir que la inteligencia artificial está cambiando la forma en que evaluamos, abriendo la puerta a métodos más precisos y personalizados que pueden mejorar el aprendizaje y adaptarse a cada estudiante. Sin embargo, al integrar la IA en los procesos de evaluación, debemos mantener un enfoque ético y humano, utilizando la tecnología como una herramienta para enriquecer, no reemplazar, el juicio experto.
En la era de la IA, evaluar correctamente significa combinar lo mejor de ambos mundos: el análisis eficiente y adaptativo de la tecnología con la comprensión y empatía humana. Al hacerlo, podemos construir sistemas de evaluación que realmente reflejen el aprendizaje y preparen a los estudiantes para un futuro impulsado por la tecnología y el conocimiento.
Qué es lo práctico, qué es lo que debemos realmente aprender… No olvides que desde el inicio de la humanidad esa fue la pregunta rectora, lo bueno es lo que funciona bien.
Escrito por: Eduardo Montoya Castañeda – Director general ESE – Latam.