Geschichtsmatura. Christian Pichler
Erfassung der Lernprozesse kaum geleistet werden kann. Das betrifft auch Geschichte, wo die Klärung der systematischen Verknüpfung der Inhalte des Fachs mit den Teilkompetenzen fehlt. Daher stehen zwei Zugänge zum Forschungsproblem in Diskussion. Eine Richtung propagiert die Nutzung von sozialwissenschaftlichen Verfahren und deren Adaptierung auf historisches Verstehen hin. Da es um die Beschreibung von Kompetenzen und deren – zumindest tendenzielle – Messung geht, werden ausschließlich positivistisch-empirische Verfahren abgelehnt und es wird die Anwendung konstruktivistisch-phänomenologischer Methoden präferiert.565 Der andere Zugang erwächst aus dem Bemühen um die Entwicklung domänenspezifischer Untersuchungsmethoden. Ein aufschlussreicher Debattenbeitrag zur Frage, wie genuin geschichtsdidaktische Messverfahren aussehen könnten, stammt von Borries, der schon in der 1990er Jahren empirische Studien zum Geschichtsbewusstsein junger Menschen vorgelegt hat.566 Borries weist darauf hin, dass in der Geschichtsdidaktik zunächst eher Stoff-Canones untersucht worden sind (Lernstandserhebungen). Messungen dieser Art („Richtig-Falsch-Verfahren“) sind methodisch einwandfrei, die Ergebnisse erscheinen als objektiv, sind aber nicht zufriedenstellend, weil sie aus eindimensionalen Aussagen (Wissensdefizite) bestehen. Kompetenzgrade können damit nicht erhoben werden, da es an Parametern (Perspektivität, Kontroversialität, Pluralität etc.) mangelt. Wesentliche Denkoperationen bleiben unbeachtet, weil falsche Ergebnisse nicht zählen, wodurch mentale Prozesse, die Proband*innen zwar weitergebracht, aber nicht zur Lösung der operationalisierten Fragestellungen geführt hätten, keine Berücksichtigung finden. Somit eignen sich herkömmliche Unterrichtsdiagnosen nicht als Messinstrumentarium für die Erhebung und Skalierung historischen Denkens. Borries hat daher vorgeschlagen, Analyseverfahren auszudifferenzieren. Zunächst sollte sich die Forschung auf einzelne wesentliche Aspekte beschränken, das Untersuchungsinteresse präzise beschreiben und auf der Basis der Prinzipien der Reliabilität, Validität, Objektivität und Ökonomität Mess-Systeme entwickeln. Damit würden zumindest einige spezielle Denkleistungen sichtbar zu machen sein und eingeschätzt werden können. Da die Voraussetzung für eine sinnvolle Kompetenzmessung eine Vorstellung von der Graduierung der Kompetenzen ist,567 propagiert Borries eine Standardisierung und breit angelegte Messung der Erreichung der Standards. Zuvor sollte auf der Basis von Einzeldiagnosen die praktische Anwendbarkeit eines Modells überprüft werden. Borries plädiert für das Sichtbar-machen von Kompetenzentwicklung in Intervallen, weil nur so Modelle der Lernförderung entwickelt werden könnten und schulpraktischer Nutzen aus der Empirie gezogen werden würde.568
Der Vorschlag einer schrittweisen Annäherung an taugliche Kompetenzmessungen wird innerhalb der Fachdidaktik kontrovers diskutiert. Pandel stimmt mit Borries darin überein, Kompetenzmodelle auf ihre Anwendbarkeit im Unterricht hin zu untersuchen. Auch für ihn ist eine „Theorie der Lernprogression“569 eine conditio sine qua non einer sinnvollen Messung von Kompetenzen. Pandel gibt aber zu bedenken, dass die Berücksichtigung entwicklungspsychologischer Einflüsse auf das Lernen einen gravierenden Komplikationsfaktor jedes Messverfahrens darstellt, denn es sei zu bezweifeln, dass die Verknüpfung von Kompetenzen (Progression) mit dem Reifungsprozess junger Menschen gelingen kann. Auf der einen Seite sei es „[…] eine unabweisbare plausible Forderung, dass man historische Lernprozesse gemäß den Lebens- und Lernaltern der Schülerinnen stufen muss“,570 auf der anderen Seite hätten bisherige Erkenntnisse gezeigt, dass in der gewünschten Weise nicht gelingt. Pandel gibt zu bedenken, dass das Fach Geschichte über keine „innere Logik“ verfügt. Es sei „[…] geradezu das Fach par excellence, dessen Aufgabe es ist, Kontingenzerfahrungen zu verarbeiten, der Zufälligkeit von Ereignissen Sinn zu geben.“571 Daher schlägt er vor, bloß einzelne zentrale Operationen zu messen. Seiner Ansicht nach sollte das die Sinnentnahme aus Quellen sein, weil deren Untersuchung Erkenntnisse über grundlegende historische Fähigkeiten ermöglicht und in jeder Schul- und Altersstufe durchführbar ist.572 EPA attestiert er, seine Vorstellungen zu verwirklichen. Das Format erscheint ihm für die Abiturprüfung geeignet, solange es kein konsensfähiges domänenspezifisches Messverfahren entwickelt gibt.573 Borries lehnt den Vorschlag Pandels als „Scheinlösung“ und „Taschenspielertrick“574 scharf ab. Er gewährleiste keine differenzierte Messung von (Teil-)Kompetenzen und deren Stufung,575 fördere die Konstruktion prototypischer Aufgaben und die Erstellung von Aufgabenkatalogen.576 Untersuchungen dieser Art könnten auch Sozialwissenschaften leisten.577
Abweichend von Pandel und von Borries rückt Gautschi die „narrative Kompetenz“ ins Zentrum seiner Überlegungen zur Kompetenzmessung und lenkt damit die Aufmerksamkeit von Ergebnis-Messung auf die Kategorie Wirkungsforschung („guter Geschichtsunterricht“). Narrative Fähigkeiten zu entwickeln und auszudifferenzieren hält er für die vorrangige Aufgabe von Schulunterricht, in ihnen manifestiere sich historisches Lernen. Er kritisiert eine Verengung des Diskurses auf den Aspekt „Output“ und sieht darin die Gefahr, den Unterricht aus dem Auge zu verlieren. Zwar begrüßt Gautschi die Entscheidung, Kompetenzorientierung als Denk- und nicht als Lernmodell zu verstehen und erwartet sich dadurch eine „[…] langfristige Veränderung von Wissen, Überzeugungen, Fähigkeiten und Interessen“,578 was zur gewünschten Orientierung in der und durch die Geschichte führe. Vorerst scheint ihm jedoch der Fokus „[…] auf den real stattfindenden Unterricht“ essenzieller und der „[…] Schlüssel für die schulische Qualitätspflege“579 zu sein. Daher schlägt er die Erarbeitung von Messverfahren vor, die das Gelingende der täglichen Unterrichtsarbeit zum Interesse empirischer Forschung machen. Da noch nicht ausreichend geklärt ist, an welchen Indikatoren Unterrichtsqualität festzumachen ist und welche Wechselwirkungen zwischen ihnen bestehen, plädiert er für triangulative Verfahren, da sie die Arbeit der Lehrenden und die Ergebnisse der Schüler*innen beleuchten und beides zu einem Bild zusammenfügen können.580 Die Resultate würden sowohl Beiträge zur Qualitätsverbesserung im Unterricht liefern als auch Anregungen zur Theoriebildung und zur methodischen Weiterentwicklung in der empirischen Fachdidaktik-Forschung.581 Zieht man aus der älteren fachdidaktischen Debatte der 2000er Jahre ein Zwischenresümee, so zeigt sich eine Übereinstimmung renommierter Vertreter*innen der Geschichtsdidaktik in der Auffassung, dass Kompetenzen und deren Progressionen zu messen sind, dass adäquate Messverfahren erst entwickelt werden müssen und dass es, ungeachtet des frühen Entwicklungsstadiums der Theorie, wegen deren Implementierung der Kompetenzmodelle in die Schulsysteme provisorischer Mess-Systeme bedarf, um den Paradigmenwechsel im Unterricht forschend zu begleiten und zumindest punktuelle Ergebnisse zu liefern. Dissens herrscht darüber, was und wie gemessen werden soll. Die Vorschläge reichen von der Analyse einzelner, als relevant anzusehender Teilkompetenzen mittels spezieller Aufgaben (Pandel) über die Messung spezieller Fähigkeiten und Fertigkeiten mit Hilfe offener Verfahren (v. Borries) bis zur triangulativ angelegten Untersuchungen des real stattfindenden Unterrichts mit Blick auf die Progression anhand von narrativen Kompetenzen (Gautschi). Ungeklärt geblieben ist vorerst die Frage nach genuin fachdidaktischen Messverfahren. In der Folge werden einige interessante Versuche der Fachdidaktik exemplarisch gewürdigt, valide Messverfahren zur Erfassung von Kompetenzen zu entwickeln und auf ihre Funktionalität zu prüfen.
5.2 Ausgewählte Beispiele empirischer Kompetenzmessversuche
Borries hat bereits 1973 erste Versuche unternommen, auf der Basis der Erkenntnislogik die Tauglichkeit von Aufgabenstellungen zur Überprüfung von Methodenkompetenz zu untersuchen.582 Da die Fachdidaktik der 1970er Jahre wissensorientierte Testverfahren dominiert haben, ist diesen Befunden wenig Beachtung geschenkt worden. Daher hat Borries, den damaligen Trends folgend, 1974 mit quantitativen Verfahren (Multiple-Choice-Tests) Fähigkeiten historischen Denkens zu erkunden versucht. Der Befund ist negativ ausgefallen und hat gezeigt, dass Aufschlüsse über Kompetenzen mit geschlossenen Verfahren nicht zu gewinnen sind. Demgegenüber brachten triangulative Vorgehensweisen (geschlossene Fragen in Kombination mit offenen Formaten und Nach-Interviews), Portfolioanalysen, Untersuchungen von Essays, Referaten, Rezensionen, Projektberichten und die Beobachtung von Rollen- oder Planspielen (auch Theateraufführungen) sowie die langfristige analytische Begleitung individueller und gruppenspezifischer Arbeiten oder geschichtskultureller Aktivitäten Ergebnisse, die Fähigkeiten sichtbar gemacht hatten. Ihre Durchführung war aufwändig.583 Borries hat aus seinen frühen Forschungen drei Schlussfolgerungen