Más allá de las pruebas/Beyond testing. Deborah Meier

Más allá de las pruebas/Beyond testing - Deborah Meier


Скачать книгу
estudiantes solo para proveer estimados del aprendizaje y no agregarle decisiones de alto impacto a estos resultados. Estas muestras nos permiten hacer las preguntas de mayor profundidad, puede ser diseñadas como entrevistas y pueden tener el mismo valor que solicitar respuestas orales o escritas, pero previniendo que impacten en un estudiante, profesor o escuela en particular. Además, si las preguntas se hacen públicas a la comunidad, incluyendo los estudiantes y profesores, se pueden criticar tanto las preguntas como las respuestas, y esto realmente ayuda. Como en las encuestas, saber cómo se hace una pregunta, qué alternativas son ofrecidas y qué elementos componen el instrumento de puntuación es esencial para cualquier interpretación razonable.

      Algunas de las evaluaciones que describimos en este libro son, de hecho, generalmente usadas sobre una base muestral. El proceso de Pat Carini (véase capítulo cinco) es bastante extenso e involucra múltiples participantes. Aunque generalmente esté limitado a estudiantes que son particularmente desafiantes para el profesor, es un muestreo de población que nos entrega perspectivas sobre muchos otros chicos a los cuales enseñamos.

      Los portafolios de graduación o las evaluaciones o de rendimiento usadas por las escuelas Consortium (véase capítulo diez) a veces incluyen pequeños controles y están basados en una idea similar que busca destacar el muestreo en el sentido que las pruebas se centran en una pequeña porción del conocimiento o las habilidades del estudiante. Mientras que los estudiantes, por ejemplo, no hacen presentaciones que cubran la totalidad de lo que han estudiado (y aprendido), la forma de la presentación y cómo se lleva acabo su defensa nos entrega una idea mucho más poderosa sobre como un estudiante puede abordar materias o conceptos que una prueba tradicional. Es un tipo de muestreo que nos deja ver cómo es un estudiante en cuanto a su aprendizaje y qué tal él o ella podrá manejar estudios en el futuro. Pero entendemos que estos son solo estimados.

      Incluso las múltiples formas de evaluación de lectura que discutimos aquí están, en muchas formas, basadas en el muestreo. Por supuesto, todo tipo de pruebas solo es una muestra de cómo el estudiante responde al material un día específico en comparación con otro, pero esto también sucede con otras formas de evaluación. Cuando los profesores se sorprenden con los resultados de las pruebas estandarizadas que son evaluadas en otro recinto, no tienen la posibilidad de pedir que se vuelva a impartir la prueba o ignorar los resultados por ser poco precisos. Ahora bien, en el caso de las evaluaciones que presentamos en este libro, asumimos que son específicas para un momento, a pesar de que intentamos diseñarlas para que puedan servir a propósitos más amplios. Sin embargo, tenemos la posibilidad de cuestionar la herramienta de evaluación junto con el cómo y el porqué el evaluador llegó a una conclusión específica. En la escuela Mission Hill en Boston, pusimos en marcha una escala de cero a cinco sobre fluidez en la lectura para los cursos desde kínder hasta octavo, y pasamos una cantidad de tiempo considerable tratando de acordar qué indicaba cada número y cómo lo describiríamos a los chicos y a sus familias. Esto era muy importante, ya que las categorías de 0–5 cubrían un gran terreno entre no poder leer y leer fluidamente cualquier cosa apropiada a su edad o curso. Es por esto que se llevaban a cabo múltiples evaluaciones que apuntaban hacia la grabación de esta evaluación sumativa (la que en Mission Hill era grabada en video o en audio) y que funcionaban como respaldos importantes.

      Lo que una buena evaluación necesita es un descriptor preciso y no una comparación que categoriza de mejor a peor. Probablemente, no hay forma de evitar que alguien convierta cualquier cosa en una herramienta comparativa de alguna forma, lo que podría llegar hacer un instinto humano saludable. Así, por ejemplo, Mission Hill tenía el objetivo de que todos los chicos estuviesen en el nivel cuatro de fluidez lectora en algún momento antes de terminar su cuarto grado. Si notábamos una baja, nos hacíamos preguntas, y algunas de ellas nos llevaban a revisar los instrumentos o nuestra propia práctica.

      Pero es importante recordar que cualquier orden de clasificación es engañoso, y rara vez tan importante como lo hacen parecer. No importa cuánto practiquemos, o qué tan obediente son todos los chicos, cuando los llamemos a formarse luego del recreo, siempre la mitad de ellos estará enfrente y un solo niño estará al final. Es también una fortuna que no todos los niños tienen tanto ímpetu por estar en el frente. De igual forma, a algunos estudiantes no les importa tanto el obtener la respuesta correcta en las pruebas, sino la integridad de sus respuestas y que puedan defenderlas. Enseñarles trucos para adivinar o cómo meterse en la estructura mental de quienes diseñaron las pruebas para algunos chicos puede ser destructivo y, quizás, inmoral en sus propios códigos de ética.

      Aún más, con respecto a esa pretensión de exactitud en las pruebas que no pueden ser evaluadas con puntaje, la idea de aprobado/reprobado es una locura. El error de medida es sustancial de acuerdo con los diseñadores de pruebas estandarizadas y puede fallar por mucho. Cuando solíamos obtener puntajes que pretendían medir el nivel del curso –6,3 implicaba el puntaje medio para estudiantes en el tercer mes del sexto grado– de hecho, no lograba medirlo. Tal cual como formarse en línea, solo podía decirnos a nosotros y a los padres que obtuvo más o menos respuestas correctas, y luego proveer un valor numérico para conectar con las respuestas. La mayoría de las pruebas estandarizadas actuales entrega lo que se llama un puntaje “normado políticamente”. Un grupo de expertos decide qué puntajes deben ser considerados “excelente”, cuales “bien”, cuáles “suficiente” y cuáles “reprobado”. Todavía puedes alinearlos, pero la decisión de qué hace que el 86 sea lo suficientemente bueno, pero 83 no, es una decisión que toma alguien a la distancia y en una posición mucho más alta en una escala de poder.

      En resumen, no importa si lo llamamos evaluar a un estudiante, a una clase o a un profesor: siempre es una decisión subjetiva. Quien toma esta decisión podría estar equivocado. Conversar abiertamente sobre cómo llegamos a nuestras decisiones y la evidencia que usamos cuando necesitamos tomar una, ayuda significativamente. Qué tan seguido y con qué propósito tomamos estas decisiones debería hacer algo que cada comunidad escolar evalúe en conjunto y llegue a un “paquete” de acercamientos que satisfagan a los tres grupos –estudiantes, profesores y familias– al ser útiles, comprensibles y tolerables para cada uno. Al igual que las decisiones tomadas por aquellos con mayor poder, debiese siempre haber mecanismos para apelar a las decisiones. Probablemente nadie opine perfecto de nosotros –ni nosotros lo hacemos– pero algunos intentos de juicios hacen daño considerable y otros son altamente útiles para ayudar a todos los involucrados. Esto último es lo que buscamos con este libro. En términos escolares, esto significa que todos los grupos involucrados, como mínimo, deberían tener acceso a toda la evidencia involucrada y deberían tener una oportunidad de ofrecer interpretaciones alternativas cuando y si es que hay consecuencias que los podrían ayudar o dañar. Ese es el principio número uno en la búsqueda de una evaluación justa.

      Las evaluaciones que elegimos para perfilar y describir en este libro están divididas en siete categorías básicas:

      1. Autoevaluaciones de estudiantes: oportunidades para motivar a los estudiantes a que piensen críticamente sobre su propio trabajo, utilizando herramientas u ocasiones estructuradas, tales como reuniones familiares, rúbricas o la colección de reflexiones llamada recuerdos.

      2. Observaciones de parte del profesor acerca de los estudiantes y su trabajo: profesores actuando como observadores o etnógrafos, anotando, recogiendo, sintetizando y analizando miles de piezas de información acerca de sus estudiantes a medida que ellos hacen su trabajo diario.

      3. El proceso de revisión descriptiva: una forma organizada de recoger observaciones y otras piezas de evidencia, enfocándolas alrededor de una pregunta que funciona como marco y discutiendo la pregunta, o un trabajo particular, o evaluación del chico con un grupo de adultos.

      4. Entrevistas de lectura y matemáticas: evaluaciones de las habilidades de comprensión lectora y matemática de los estudiantes utilizando procesos tales como escuchar grabaciones de estudiantes


Скачать книгу