Articles

13.7: Probleme mit standardisierten Tests

Sind standardisierte Tests voreingenommen?

In einer multikulturellen Gesellschaft ist eine entscheidende Frage: Sind standardisierte Tests voreingenommen gegenüber bestimmten sozialen Klassen, Rassen oder ethnischen Gruppen? Diese Frage ist viel komplizierter, als sie scheint, denn Voreingenommenheit hat eine Vielzahl von Bedeutungen. Eine alltägliche Bedeutung von Voreingenommenheit bezieht sich oft auf die Fairness der Verwendung von standardisierten Testergebnissen zur Vorhersage der potenziellen Leistung von benachteiligten Schülern, die bisher nur über geringe Bildungsressourcen verfügten. Sollte beispielsweise Dwayne, einem Schüler, der hart gearbeitet hat, aber aufgrund der schlechten Schulen in seiner Nachbarschaft und der geringen Bildungsressourcen in seinem Elternhaus nur begrenzte Bildungschancen hatte, der Abschluss der High School aufgrund seines Ergebnisses in einem Test verweigert werden? Es war nicht seine Schuld, dass er nicht über die nötigen Bildungsressourcen verfügte, und wenn er eine Chance bekäme, sein Umfeld zu verändern (z. B. indem er auf ein College geht), könnten seine Leistungen aufblühen. Nach dieser Auffassung spiegeln Testergebnisse gesellschaftliche Ungleichheiten wider und können Schüler, die weniger privilegiert sind, bestrafen, und sie werden oft fälschlicherweise als Ausdruck einer festen, vererbten Fähigkeit interpretiert. Forscher betrachten die Voreingenommenheit in der Regel auf technischere Weise, und es werden drei Themen erörtert: Inhalt und Format der Aufgaben, Genauigkeit der Vorhersagen und stereotype Bedrohung.

Inhalt und Format der Aufgaben. Testaufgaben können für einige Gruppen schwieriger sein als für andere. Ein Beispiel für die Voreingenommenheit aufgrund der sozialen Schichtzugehörigkeit ist ein Multiple-Choice-Item, bei dem die Schüler nach der Bedeutung des Begriffs „Feld“ gefragt wurden. Die Schüler sollten den kursiv gedruckten ersten Satz lesen und dann die Antwort auswählen, die die gleiche Bedeutung wie „Fachgebiet“ hatte (Popham 2004, S. 24):

Das Fachgebiet meines Vaters ist Computergrafik.

  1. Der Pitcher konnte seine Position einnehmen
  2. Wir bereiteten das Feld vor, indem wir es pflügten
  3. Der Arzt untersuchte mein Sichtfeld
  4. Welches Feld wirst du nach dem College betreten?

Kinder von Fachleuten verstehen diese Bedeutung von „Feld“ eher, da Ärzte, Journalisten und Anwälte „Felder“ haben, während Kassiererinnen und Wartungsarbeiterinnen einen Beruf haben, so dass ihre Kinder diese Bedeutung von „Feld“ eher nicht kennen. (Die richtige Antwort ist D).

Die Testunternehmen versuchen, diese Art von inhaltlichen Problemen zu minimieren, indem sie Testentwickler mit unterschiedlichem Hintergrund die Aufgaben überprüfen lassen und statistisch untersuchen, ob bestimmte Gruppen einige Aufgaben leichter oder schwerer finden. Dennoch gibt es Probleme, und eine kürzlich durchgeführte Analyse der verbalen SAT-Tests ergab, dass Weiße bei leichten Aufgaben besser abschneiden, während Afroamerikaner, Hispanoamerikaner und asiatische Amerikaner bei schweren Aufgaben besser abschneiden (Freedle, 2002). Obwohl diese Unterschiede nicht groß sind, können sie die Testergebnisse beeinflussen. Die Forscher gehen davon aus, dass die leichten Aufgaben, die Wörter enthalten, die in der täglichen Konversation verwendet werden, in den verschiedenen Subkulturen subtil unterschiedliche Bedeutungen haben, während die schweren Wörter (z. B. Vehemenz, Kriecher) nicht in jeder Konversation verwendet werden und daher nicht diese Bedeutungsunterschiede aufweisen. Auch die Prüfungsform kann die Prüfungsleistung beeinflussen. Frauen schneiden in der Regel bei Aufsatzfragen besser ab, und als der SAT kürzlich eine Aufsatzkomponente hinzufügte, verbesserten sich die weiblichen SAT-Gesamtergebnisse im Vergleich zu den männlichen (Hoover, 2006).

Eine Antwort schreiben

Deine E-Mail-Adresse wird nicht veröffentlicht.