Evaluación por desempeño vs. evaluación por cumplimiento

noviembre 25, 2021
12:58 pm

Evaluación por desempeño vs. evaluación por cumplimiento

Con motivo de los cambios a las normas para la evaluación, promoción y acreditación en la educación primaria
Calidad Educativa Consultores S.C.

Vol.: 06, 2013/37

Calidad Educativa Consultores S. C., te envía nuestro boletín electrónico del bimestre con el tema: “Evaluación por desempeño versus evaluación por cumplimiento”, con motivo de los cambios a las normas para la evaluación, promoción y acreditación en la educación primaria que aparecieron recientemente en el Acuerdo No. 696 en el Diario Oficial de la Federación el día 20 de septiembre del 2013.

En este artículo hacemos un análisis de las ventajas y desventajas que tenía el Acuerdo No. 648 y por otro lado las que supone el nuevo Acuerdo No. 696, mismas que se identifican en que en el primer caso se hacía un énfasis en la evaluación del desempeño identificando como categoría de análisis del mismo la autonomía en dónde se determinaba qué tanto dominaban los aprendizajes esperados por sí mismos los estudiantes, es decir si lo hacían solos y bien o requerían ayuda; mientras que en el segundo, en el nuevo acuerdo, se identifica el cumplimiento mínimo de los aprendizajes esperados lo que implica observar el resultado en términos cuantitativos tomando como base el 6, lo que implica que se establece una pequeña exigencia para que se alcancen puesto que sólo hay dos opciones o cumple o no lo hace.

Lo importante a señalar es que en ambos casos lo que se observa como perspectiva de la evaluación: la autonomía en el dominio de los aprendizajes esperados, o el cumplimiento mínimo de los mismos para acreditar un bloque o una asignatura, no lleva a observar la eficacia como una categoría de análisis del desempeño de los estudiantes que eleve la calidad educativa entendida tal y como lo dice el artículo 3o como: el mejoramiento constante y el máximo logro académico de los educandos, puesto que no se observa si lo que hacen resuelve las situaciones de una manera más compleja.

El objetivo de este artículo es brindar los elementos necesarios para impulsar un proceso de evaluación que cumpliendo con las normas establecidas en el acuerdo número 696 que hace énfasis en los exámenes bimestrales y finales, recupere el enfoque de la evaluación establecido en el Acuerdo No. 592 y en el artículo 3o constitucional que se centra en impulsar la calidad entendida como la mejora continua de los logros alcanzados.

Al finalizar el acuerdo brindamos información sobre algunos puntos concretos para diseñar los exámenes desde esta perspectiva.

Este documento es gratuito y se puede distribuir de manera libre siempre y cuando se cite la fuente y se reproduzca respetando la intención original de la autora.

Evaluación por desempeño vs. evaluación por cumplimiento

Dra. Laura Frade Rubio

La Secretaría de Educación Pública publicó en el Diario Oficial de la Federación del día 20 de agosto del 2013 el Acuerdo número 696 por el que se establecen normas generales para la evaluación, acreditación, promoción y certificación en la educación básica, mediante el cuál se deroga el acuerdo no. 648 y el 685 publicados el día 17 de agosto del 2012 y el 8 de abril del 2013 respectivamente y sobre el mismo tema.

En este nuevo acuerdo se elimina la evaluación que visualizaba la autonomía como categoría de análisis del desempeño escolar que observada en 4 niveles: destacado, que se describía como aquel que lo hacía sólo y bien y por eso requería conservar el apoyo que se le brindaba y cuya calificación era 10 o bien de A. Satisfactorio quién lo hacía sólo y con errores y por lo tanto necesitaba un esfuerzo adicional para mejorar y quién recibía un 9 u 8 o bien una B. Suficiente que era aquel que lo hacía con ayuda, requería de apoyo constante y de soporte por lo que se le otorgaba un 7 o 6 que es equivalente a una C, e insuficiente quién lo hacía con una ayuda más especializada ya requería de un apoyo sistemático y diferenciado y cuya letra era la D, lo que implicaba que contaba con una calificación menor de 5. Este es un esquema complejo ya que incluye los indicadores cualitativos y su respectiva representación cuantitativa que observa tanto el proceso como el resultado que se alcanza

Ahora con este nuevo acuerdo se regresa a una evaluación del desempeño cuya categoría de análisis del quehacer del estudiante se observa a partir del cumplimiento de los mínimos establecidos en los planes y programas, lo que se identifica en el establecimiento de una línea base: si se tiene más de 5, es decir 6, ya pasó, ya la hizo y no hay que preocuparse, sino pasa deberá hacer exámenes de recuperación o bien extraordinarios en el caso de secundaria. Este es un esquema básicamente sumativo que identifica el resultado final exclusivamente.

Podemos afirmar que ambos esquemas de evaluación cuentan con sus ventajas y desventajas, y que tomar una decisión sobre cómo se deben evaluar los millones de niños y niñas en el país conlleva una gran responsabilidad. Analicemos qué es lo que ofrece cada esquema de evaluación.

El primer esquema, el que sigue siendo nuevo a pesar de que ahora es antiguo, tiene como ventajas que por naturaleza es complejo, es decir que abarca todas las dimensiones de la evaluación, ya que identifica:

a) Una categoría de análisis del desempeño que resulta básica a observar en cualquier proceso educativo: la autonomía, es decir que el sujeto deberá demostrar su aprendizaje a partir de que pueda hacer las cosas por sí mismo pero además haciéndolo bien, es decir cumpliendo con las expectativas sociales.

b) El proceso que se realiza y el resultado que se alcanza, puesto que al analizar qué tanto hace por sí mismo y en qué medida tiene errores, se puede identificar en dónde tiene qué mejorar para alcanzar mejores logros.

c) El resultado que alcanza por lo que puede hacer por si mismo.

d) Los aspectos cualitativos y cuantitativos que los representan en una relación que no se concentra en una palomita o en un tache, sino en la identificación de la medida en que el sujeto puede hacer las cosas con independencia.

e) Una escala de representación en letras y números que permitía el tránsito internacional a Estados Unidos y Canadá que utilizan las letras.

En pocas palabras este esquema obedecía más a las necesidades de evaluación del Siglo XXI porque dirimía los viejos dilemas: o se observaba la calidad o se observaba la cantidad, o se identificaba el proceso o se observaba el resultado, o se calificaba con letra o bien con número, o se identificaba la autonomía o sólo el cumplimiento, era un esquema complejo en el que se evaluaba todo a la vez.

No obstante, dada su complejidad contaba con ciertas debilidades, la primera era que una evaluación de esta naturaleza requiere de una capacidad docente más construida que lo llevara a identificar todo esto en su proceso de evaluación mediante un sistema que pudiera recopilar la evidencia de aprendizaje de inicio a fin, con una metodología que le permitiera identificar quién había logrado la autonomía total en el caso del destacado, y quién no en términos de contar con errores, o bien de requerir apoyo o ayuda diferenciada del resto del grupo.

La segunda debilidad de este esquema de evaluación se encontraba en que la autonomía como tal es una categoría de análisis del desempeño mínima, es decir no observa niveles de complejidad en la actuación del sujeto que van más allá del sólo hecho de hacer las cosas por sí mismo y bien. Por ejemplo lo que hace un estudiante al aprender, es decir su desempeño se puede observar desde la eficacia, o sea desde su capacidad para resolver lo que enfrenta con mejores niveles de adecuación a lo que se le solicita puesto que algunos sujetos pueden responder mejor que otros a las situaciones que se presentan, así mientras un niño o niña de segundo de primaria ejecuta el aprendizaje esperado: Selecciona palabras o frases adjetivas para elaborar descripciones (SEP, 2011) y para lo cual describe un objeto diciendo: “El aguacate es verde y tiene forma de huevo”, otro señalará: “El aguacate es verde por dentro, negro por fuera, tiene una forma ovalada y además cuenta con un hueso que servirá como semilla”. Entre las dos respuestas hay diferencias y aunque en ambos casos se llevó a cabo una descripción, el nivel de eficacia para responder a la demanda fue mucho mayor en el segundo caso que en el primero.

Si analizamos ambas respuestas desde la perspectiva de la autonomía ambas serán correctas, lo pudieron hacer por sí mismos y hasta cierto punto bien, pero si identificamos la eficacia como categoría para analizar lo que cada uno hace entonces observaremos que una respuesta es mejor que la otra porque la profundidad en la descripción que logra el segundo es mucho mayor. Desde esta visión cuando sólo se identifica lo que los sujetos pueden hacer por sí mismos el nivel que se logra es mínimo. El problema con esto es que en el Siglo XXI los sujetos que salgan adelante, no sólo serán aquellos que realicen las cosas con independencia sino los que resuelvan con mayor complejidad, es decir con eficacia.

El otro asunto que el esquema de la autonomía no observa es que además se deja fuera de la observación al estudiante con capacidades sobresalientes, porque hará las cosas por sí mismo, pero no se le exigirá un nivel de compromiso de acuerdo a sus posibilidades.

En tercer lugar, como este esquema es complejo está centrado en el desempeño autónomo de índole formativo y sumativo, así como cualitativo y cuantitativo al mismo tiempo, lo que implica que para evaluar a los estudiantes así se requiere de tiempo, sobre todo cuando se cuentan con más de 50 alumnos por grupo en la secundaria, es decir un total de 250 o 300 en la vida real, puesto que no sólo se imparten clases a un solo grupo, y si bien esto se resuelve mediante el diseño de un sistema que recopile evidencia en productos manejables, cortos y sintéticos que realmente demuestren que el estudiante aprendió, todavía no se cuenta con la capacidad construida para diseñar estas herramientas como ya se mencionó.

Por otra parte, el esquema de evaluación centrado en la identificación del cumplimiento como categoría de análisis del desempeño que observa sólo el resultado alcanzado y que se asume solo como sumativo, al identificar solo el resultado final, cuenta también con sus ventajas y sus desventajas.

Las ventajas están relacionadas básicamente con dos aspectos:

1. Al observar sólo el proceso sumativo, se identifica fácilmente si el estudiante logró la meta o no, lo que implica que si no lo hizo se deberán llevar a cabo actividades de recuperación que garanticen que llegan a los aprendizajes esperados que se han establecido en los planes y programas que se han estipulado.

2. Es mucho más manejable para el docente diseñar y aplicar exámenes que observen el resultado que se logra para identificar qué sigue, sobre todo cuando cuenta con grupos grandes y además varios grupos a la vez, como 250 o 900 en total, como me lo decía un maestro de educación física, puesto que era el único docente que existía en una secundaria oficial.

No obstante este esquema tiene también sus desventajas:

a) Al no identificar ni la autonomía ni la eficacia como otra categoría de análisis del desempeño y calificar sólo por cumplimiento del estándar mínimo, es decir que si lo hizo “bien”, ya obtuvo una palomita, lo que se hace es bajar la calidad educativa, porque lo que estamos haciendo es observar el mínimo posible. Retomemos otra vez el mismo ejemplo de una descripción de segundo de primaria, si un estudiante escribe: “El aguacate es verde y tiene forma de huevo”, y otro redacta: “El aguacate es verde por dentro, negro por fuera, tiene una forma ovalada y además cuenta con un hueso que servirá como semilla”. En ambos casos estará bien aunque el nivel de desempeño real entre ambos sea totalmente diferente. Es decir que la exigencia en términos de cumplimiento es igual, o incluso menor que en el caso de la evaluación del desempeño por autonomía, porque con que se cumpla un mínimo el sujeto pasa, se le acredita y no se le exige más de lo que ha hecho.

b) Cuando la categoría es el cumplimiento no se identifica qué tiene que mejorar el sujeto, porque si cumple siempre estará bien, la mejora como meta final del aprendizaje sólo será para aquel que no cumple con el estándar mínimo. Así cualquiera que saque 6 pues será igual que el que saque 10, tal y como ha sido a la fecha, puesto que aunque existen reconocimientos sociales al niño o niña que se ha sacado la máxima calificación, la diferencia sólo es cuantitativa, lo que se identifica es que tuvo 10 buenas en lugar de 6, pero no se observa la calidad del trabajo realizado, aspecto que además se retoma en el acuerdo haciendo énfasis en que las observaciones se harán para quién requiera apoyo fuera del horario escolar (Artículo 8o. y 12o del Acuerdo núm. 696) .

Así que los dos esquemas suponen dilemas no resueltos, mientras que el esquema de evaluación del desempeño complejo en el que se observa todo a la vez, se identifican las áreas de oportunidad y de mejora para el estudiante al identificar lo que logra hacer en el proceso y en el resultado por sí mismo, no se observan otras dimensiones del desempeño que conlleven a logros más profundos en el aprendizaje, y mientras que cuando solo se evalúa el cumplimiento tampoco, ya que solo se identifica un estándar mínimo, y aunque el esquema anterior era mucho mejor porque si establecía un proceso de mejora, éste seguía siendo de mirada corta.

El problema fundamental y esencial en ambos casos, es el diseño de los planes y programas actuales, los que se definieron en el 2011, que al estar orientados a desarrollar competencias mediante los aprendizajes esperados, las ejecuciones descritas en los mismos, no pueden ser observadas sólo por el cumplimiento o no de ellos, sino también por la profundidad y calidad con la que se logren, mismas que implican la autonomía del estudiante pero también la eficacia para resolver lo que enfrentan, y si se aplica un examen como ENLACE que dura varias horas también conlleva a identificar la eficiencia en la resolución, es decir qué tan rápido lo realiza, porque quién lo hace muy lento aunque lo haga bien no terminará y muy probablemente reprobará.

Pongamos como ejemplo el siguiente aprendizaje esperado:

Resuelve problemas en donde se utilice el valor posicional de los dígitos en el sistema decimal (SEP, 2011). Para evaluarlo se pueden poner varios problemas, entre ellos los siguientes (Libro de texto de 4º grado de primaria, SEP, 2013):

a) Fernando transporta costales de naranjas en su camión. Lleva un costal con 1 200 naranjas, 8 costales con 400 cada uno y un costal más con 173. ¿Cuántas naranjas lleva en total?

b) La cajera de una tienda de autoservicio entregó a la supervisora 4 billetes de $1 000, 5 billetes de $100, 7 monedas de $10, y 3 monedas de $ 1, ¿cuánto dinero entregó en total?

En el primer problema el estudiante deberá llevar a cabo operaciones más complejas que en el segundo en dónde lo único que tiene que hacer es acomodar literalmente los billetes en términos del valor posicional que ocupan. Esto implica que el nivel de dificultad del problema a) es más complejo que el de la letra b), es decir que no son iguales, su diferencia está dada tanto por el tipo de variables que se manejan como por las operaciones que deberían llevar a cabo. Así que es más probable que muchos niños y niñas respondan correctamente el segundo y mucho menos el primero.

Lo anterior trae como consecuencia que la evaluación de estos problemas se debería dar de acuerdo con el nivel de dificultad que se enfrenta, es decir que deberían de observar de manera diferente, porque no es lo mismo evaluar la resolución con dos variables semejantes entre sí, como en el caso del problema b) en el que sólo se modifica la cantidad de billetes y con ello el valor posicional de los números, a el problema b) en el que los números son discrepantes: 1200 y 400 no sólo tienen un valor posicional distinto, sino también un valor absoluto diferente lo que lleva necesariamente a hacer más operaciones, por lo tanto responder el problema a) llevará mucho más tiempo que el problema b), lo que trae como consecuencia que el nivel de eficacia y de eficiencia para abordarlos también deba observarse.

Las consideraciones mencionadas anteriormente con relación a que ambos esquemas de evaluación no observan cómo determinar la mejora continua porque no identifican la eficacia en la capacidad de resolver por parte de los estudiantes, imponen un dilema a resolverse en el aula por el docente, quién actualmente y por ley deberá impulsar la calidad educativa, entendida como el mejoramiento constante y el máximo logro académico de los educandos (Artículo 3º), lo que implicaría que se debiera observar un proceso de mejora continua en todos los casos, no sólo en aquellos que no llegan al 6 como calificación mínima en el esquema de evaluación por cumplimiento, sin también a los que alcanzan un 8, 9 o 10 identificando que pueden alcanzar niveles de complejidad más grandes en lo que hacen.

Evaluar la eficacia como capacidad para resolver las diversas situaciones que enfrenta el sujeto implica considerar otros aspectos, el nivel de compromiso, las habilidades de pensamiento que aplica como el análisis, la síntesis, la jerarquización y la organización de sus ideas, así como la inventiva, y la apertura a nuevas propuestas y posibilidades de ejecución, mismas que incluso pueden no ser vislumbradas por el docente con anterioridad.

Sin embargo en la nueva normatividad quedan algunas puertas para impulsar la calidad educativa entendida como mejora del resultado que se alcanza en los procesos de ejecución. En el caso de la evaluación del desempeño desde la perspectiva de la autonomía, el nivel destacado podía ser evaluado también como aquel que al ser autónomo puede crear, proponer e inventar, resolviendo así con eficacia, mientras que en el caso del cumplimiento también se puede identificar que aunque los estudiantes cumplan con el mínimo pueden alcanzar mejores niveles de desempeño.

Ahora bien, dado que en el esquema actual en el que sólo se está evaluando el cumplimiento por una calificación netamente cuantitativa al identificar si hace o no hace las cosas por una palomita o un tache en un examen, determinar si existen mayores posibilidades de complejidad en la capacidad de los estudiantes para resolver pareciera que es un aspecto casi imposible de llevar a cabo, pero no es así, porque lo que se puede hacer es diseñar exámenes desde una perspectiva de observación más compleja que permita identificar lo que los estudiantes pueden hacer en escenarios diversos frente a los cuáles tendría que articular todos sus recursos para responder.

Es decir, que se debería evaluar el aprendizaje no sólo por el clásico nivel de dominio que estipula qué tanto saben los estudiantes, sino también al identificar qué tanto pueden resolver demandas complejas en casos y problemas cuyos niveles de complejidad sean mayores y menores. Esto es lo que en realidad hace el examen de PISA (Programme for International Student Assessment) de la OCDE (Organización de Cooperación y Desarrollo Económico).

Esto implicaría que en lugar de que se evalúen los conocimientos adquiridos por el estudiante se identifique en qué medida resuelve con lo que sabe hacer frente a los casos y problemas de la vida que se enfrentan de manera cotidiana, estrategia que no sólo se debe aplicar en matemáticas sino en el resto de las asignaturas, como en español, ciencias, formación cívica y ética, educación artística, geografía e historia. Esto porque es muy diferente hacer una típica pregunta de examen como la siguiente:

¿Qué es el plato del bien comer?

a) es el plato que debemos comer todos los días de la vida aunque no nos guste

b) es lo tienen que comer las personas para comer sabroso y rico con todos los colores

c) es una guía para lograr una alimentación completa, equilibrada, inocua, suficiente y variada.

En lugar de hacer una como esta:

Juanito tiene problemas con su peso, está un poco pasado, tienen algunas llantitas en la cintura, tanto que ahora se cansa al caminar y correr, pero la verdad es que no puede dejar de comer dulces, galletas y refrescos y además se la pasa viendo la televisión toda la tarde cuando llega de la escuela. ¿Qué dieta debe seguir Juanito para bajar de peso?

a) Una dieta que elimine las cosas que engordan como las papas fritas, los dulces, los refrescos, las galletas y caminar algo durante el día. Nivel 2.

b) Una dieta basada en el plato del bien comer que señala la cantidad de alimentos por grupo a consumir además de hacer ejercicio diariamente y tomar mucha agua. Nivel 4.

c) Comer todo lo que quiera pero que aumente la cantidad de ejercicio que hace diariamente de manera que queme la grasa que tiene y no se siente tanto. Nivel 1

d) Comer una dieta en la que consuma más carnes, verduras y frutas, hacer algo de ejercicio, ver la tele sólo por la noche y sólo comer dulces el fin de semana. Nivel 3

Cómo se observa, en la primera pregunta sólo estamos identificando el nivel de conocimiento existente sobre el plato del buen comer, en cambio en la siguiente se observa qué sabe hacer el estudiante frente a una problemática real que se enfrenta de manera cotidiana, sobre todo en las ciudades del país, pero además estamos evaluando el nivel de desempeño que se alcanza, mismo que sí evalúa el cumplimiento, pero además la eficacia, es decir lo que se hace para resolver y responder de una manera más adecuada a la demanda que se enfrenta.

Lo anterior supone que se puede evaluar el desempeño del estudiante en un examen que identifique lo que sabe hacer frente a demandas complejas, es decir cuando se encuentre problemas reales de la vida de manera que no sólo se determine si cumple o no cumple con el mínimo requerido sino además con qué nivel de eficacia lo logra.

No obstante, la dificultad emerge en los planes y programas actuales que no sólo están diseñados para evaluar frente a casos y problemas sino también frente a la elaboración, creación y realización de productos que demuestran que el sujeto ha adquirido los aprendizajes esperados, como sería el caso de la asignatura de español en el aspecto de lenguaje escrito, la educación artística en el eje de producción, o bien educación física, en donde los y las estudiantes deberán producir para demostrar qué saben hacer con los contenidos que se incluyen en los aprendizajes esperados.

Lo anterior trae como consecuencia que el examen no podrá ser diseñado en todos los casos de la misma forma y que en ocasiones se deberá evaluar por producciones, y aunque se lleven cabo en momentos específicos diseñados para tal efecto, es decir “el día del examen final del bimestre”, o bien “al final del año” tal y como lo estipula el Acuerdo núm. 696, lo que se evalúa será una producción, por ejemplo: un ensayo, un cuento corto, una serie de textos escritos por el estudiante como lo sería una narración, una descripción, una carta, etcétera.

Evaluar por producto en un examen implica que el docente deberá diseñarlo de manera clara y precisa defiendo la instrucción que deberá brindar, el producto o producciones esperadas, así como la rúbrica analítica diseñada por niveles de desempeño con la que deberá evaluar.

Lo anterior conlleva entonces a que, dadas las características de los planes y programas actuales, así como del nuevo acuerdo de evaluación, que si bien establece el examen como una herramienta sumativa, si considera que se debe impulsar la mejora continua en el aprendizaje, por lo que se deberá construir la capacidad docente para diseñar exámenes que conlleven a evaluar lo que se estipula en los aprendizajes esperados tanto al observar el cumplimiento del mismo como mínimo, como al identificar el nivel de eficacia con el cual resuelven.

En conclusión, lo importante a observar es que independientemente de que pareciera que con el nuevo acuerdo de evaluación se da marcha atrás, esto no necesariamente es así porque el plan y los programas de estudio no lo permiten, es decir no están diseñados para que el estudiante demuestre lo que sabe hacer sólo en un examen de índole sumativo, pero además porque el contexto del Siglo XXI y sus características en la producción y generación del conocimiento no pueden llevar a una regresión en la que sólo se observe qué sabe el estudiante de manera enciclopédica, sino a que desarrolle y demuestre su capacidad de resolución en un nivel que va mucho más allá de la autonomía y que consiste en la eficacia para hacerlo, en su capacidad de respuesta entendida como la adecuación entre lo que sabe hacer y la exigencia de la demanda presentada misma que debe ser satisfecha, el sujeto debe resolverla y además con niveles más creativos.

Desde esta perspectiva evaluar en el Siglo XXI con cualquier esquema normativo que se imponga implica necesariamente la modificación del paradigma de que evaluar tiene como fin promover, acreditar y certificar, sino que básicamente es la herramienta que históricamente ha utilizado el o la educadora para identificar en qué medida ha llegado a la meta y determinar qué debe hacer para alcanzarla, mejorando tanto lo que hace él o ella como lo que hacen los estudiantes. En realidad no hay marcha atrás…

Bibliografía:

DOF, 2011, Acuerdo número 592 por el que se establece la articulación de la educación básica, SEP; DOF, 2011, México, D. F.

DOF, 2013, Acuerdo número 696 por el que se establecen normas generales para la evaluación, acreditación, promoción y certificación en la educación básica, SEP, DOF, 20 de septiembre, 2013, México, D. F.

DOF, 2012, Acuerdo número 648 por el que se establecen las normas generales para la evaluación, acreditación, promoción y certificación en la educación básicas, SEP, 17 de agosto del 2012, México, D. F.

Frade Laura, 2012, Competencias en el aula, Mediación de Calidad, S.A. de C.V., México D. F.

Frade Laura, 2013, Evaluación por competencias tomando los planes y programas 2011, Mediación de Calidad S. A. de C. V. , México, D. F.

Frade Laura , 2012, Elaboración de exámenes para evaluar competencias, Mediación de Calidad S. A. de C. V., México, D. F.

Frade Laura, 2011, Elaboración de rúbricas, metacognición y aprendizaje, Mediación de Calidad, S. A. de C. V. , México, D. F.

Sabías qué…

1. Para que un examen realmente evalúe lo que tiene que evaluar deberá cumplir con tres criterios en su elaboración:

a) Objetividad: que se observe que se está evaluando la convención social que implica que todos y todas estamos de acuerdo en el contenido que se está evaluando, no deberá haber discrepancias en la interpretación. Es decir si se evalúa un poema en español éste deberá cumplir con los criterios sobre lo que es un poema que han sido y son aceptados por los términos estipulados en los planes y programas de estudio.

b) Validez: que mida lo que quiere medir y no otra cosa, es decir que si se va a evaluar un aprendizaje esperado pues eso debe evaluar el examen. Por ejemplo si dice: Resuelve problemas con fracciones, eso es lo que se deberá identificar, no se podrá evaluar que resuelva problemas con divisiones, sino necesariamente con fracciones.

c) Confiabilidad: que se evalúe lo mismo en contextos diferentes o bien a sujetos diferentes. Por ejemplo no se puede evaluar a tres grupos que han estudiado lo mismo con un examen que es diferente, por eso se debe aplicar a todos por igual, a la misma hora para que no se baje la confiabilidad del mismo.

2. Para que un examen evalúe realmente la unidad de evaluación de los planes y programas 2011 que son los aprendizajes esperados, pero que están orientados al desarrollo de competencias, éstos se deben evaluar en contextos reales y no fuera de los mismos. Por ejemplo, si el aprendizaje dice: Interpreta el contenido de una fábula (SEP, 2011), se deberá poner una fábula para que el estudiante al leerla identifique que ésta es realmente una fábula, valga la redundancia, porque los personajes son animales y porque cuenta con una moraleja, no se le deberá preguntar: ¿qué es una fábula? Para que luego se responda: un texto corto que incluye una historia cuyos personajes son animales y de la cuál se desprende una moraleja. Esto es saber pero no saber hacer. Por esto, el desempeño que se logra en una aprendizaje esperado se demuestra cuando el estudiante al leer un texto sabe qué tipo de texto es y por qué.

3. Para que un examen realmente evalúe un bloque que corresponde a un bimestre se deberán identificar todos los aprendizajes esperados y todos los contenidos que se han abordado durante este periodo de tiempo y no sólo unos cuantos, es decir que deberá basarse en el criterio de integración de todos los elementos del mismo, se deberá evaluar completamente el bloque.

4. Para que un examen realmente lleve a mejorar la calidad en el aprendizaje se debe ir más allá de la categoría de análisis del desempeño por cumplimiento que sólo observa sí sabe o no sabe, para determinar en qué nivel de eficacia resuelve, esto impulsará la mejora continua de todos los estudiantes, de los más capaces y de los que no lo son, porque no llegaron al 6. Si esto se observa entonces se pueden tomar decisiones para mejorar, si se deja de lado no se mejora y se quedará nada más y cómo siempre se ha hecho en una observación limitada que identifica si cumple o no con los mínimos, aquí no hay decisión de mejora y por lo tanto no hay calidad.

5. Para que un examen realmente logre que el estudiante identifique lo que debe mejorar deberá ser significativo, es decir que deberá incluirse aquello que se estudio en clase y no lo que no, pero además con casos y problemas que le sean interesantes y que pueda relacionar con lo que aprendió en clase.

6. Para que un examen realmente logre resultados deberá estar diseñado tomando en cuenta lo que se estudio en clase, pero trasladándolo a otros contextos. Por ejemplo, si en segundo de primaria se diseño como proyecto un juego de “Veo,veo”, para aprender a describir objetos, en el examen se pondrá una fracción de un texto en el que haya una descripción y una narración, de manera que el estudiante identifique cuál de los dos corresponde a la primera. Esto implicará que el examen será predictivo del resultado que se alcanza, es decir cuando el estudiante estudie en su cuaderno deberá encontrar los contenidos que se evaluaran en el mismo.

7. Para que un examen realmente logre la mejora continua el docente, éste último deberá hacer un resumen estadístico de los logros obtenidos por los estudiantes, lo que quiere decir que pueda identificar por frecuencias qué reactivos respondieron correctamente todos, cuáles no, dónde estuvieron menos certeros, y qué no pudieron responder en su mayoría, porque de este análisis dependen los repasos, así como la toma de decisiones para determinar qué sigue en el aprendizaje. Al hacer este ejercicio cuantitativo de los logros de sus estudiantes estará en posibilidades de mejorar su práctica docente.

Consejos prácticos para la el diseño y elaboración de exámenes

1. Identifica el tipo de aprendizaje esperado con el que evaluarás, lo que implica determinar si se evalúa con un comportamiento o con un producto. Por ejemplo, si dice: Escucha a otros con atención y complementa su información (SEP, 2011), esto se deberá evaluar por la observación de este comportamiento en una lista de cotejo, y el examen deberá medir en qué medida cumple con el mismo por cumplimiento en dicha herramienta. En cambio si el aprendizaje esperado es: Conoce las características generales de la nota informativa (SEP, 2011), entonces se le deberá poner un texto que la incluya para que el estudiante señale las características a partir del análisis de la misma en un texto real, aquí esto se evalúa mediante el diseño de un reactivo que lo demuestra.

2. Identifica con qué casos y problemas de la vida real con contextos situacionales se podrán evaluar los aprendizajes esperados en las asignaturas correspondientes y que se describen en los planes y programas de estudio con su contenidos, estos pueden ser: fragmentos de lectura, noticias, gráficos, caricaturas, anuncios, fotografías, textos cortos, etcétera.

3. Determina los reactivos que se pueden diseñar a partir de los casos y problemas que has determinado con diferentes niveles de dificultad, de manera que se identifique no sólo lo que el estudiante sabe por cumplimiento, sino que se observe si puede resolver lo que se enfrenta con mayores niveles de complejidad.

4. Si los aprendizajes esperados sólo se pueden observar en la elaboración de un producto como es el caso de español en el que los estudiantes demuestran lo que saben al elaborarlos, entonces el día del examen pídeles que elaboren el producto en clase y a nivel personal, por ejemplo, se les puede dejar: una descripción, una fábula, un cuento, una noticia, etcétera.

5. Aprende a diseñar exámenes de manera científica, para hacerlo busca información libros y ensaya varias veces ya que no es tan fácil hacerlos; pero además es importante que seas consciente de que no se puede seguir la misma inercia que en el pasado porque, con el objetivo de que los exámenes actuales realmente respondan a las necesidades estipuladas en los planes y programas, deberán observar lo que los estudiantes saben hacer en diferentes contextos y no sólo lo que saben sobre el conocimiento que se adquiere.

Calidad Educativa Consultores S. C. es una empresa que busca impulsar la calidad en la educación desde la perspectiva del fortalecimiento y actualización de lo procesos de intervención educativa, pedagógica y didáctica que los y las docentes, sus directivos y supervisores realizan buscando responder con ello a las necesidades y el contexto del Siglo XXI. ¡Contrata nuestros servicios!