Lehrwerksintegrierte Lernvideos als innovatives Unterrichtsmedium im fremdsprachlichen Anfangsunterricht (Französisch/Spanisch). Elena Schäfer
target="_blank" rel="nofollow" href="#fb3_img_img_4900a0b0-3e6b-5454-94be-4666ea41a937.png" alt=""/>
Abb. 7: Theorie multimedialen Lernens nach Mayer (2001, 44)
Dass es sich bei der Wahrnehmung um einen komplexen und produktiven Prozess handelt, liegt nicht zuletzt darin begründet, dass höhere Verarbeitungsprozesse in Form von Korrekturmechanismen vermutlich versuchen, Merkmale und Eigenschaften, die bei der visuellen Informationsübertragung verloren gingen oder verändert wurden, nachträglich wiederherzustellen. Dies hängt zum einem mit der eigenen physischen Raumposition und Schwerkraftwirkung zusammen, zum anderen mit der Informationsübertragung auf das Netzhautbild (cf. Kebeck 1994, 164).
Fest steht, dass gerade bei der Wahrnehmung uneindeutiger Reizvorlagen (wie etwa einer unleserlichen Handschrift) der unmittelbar gegebene Kontext eine entscheidende Rolle für die Interpretation spielt. Aber auch sonst haben unser Vorwissen bzw. unsere gewohnte Kontexterwartung und -erfahrung einen erheblichen Einfluss auf unsere Wahrnehmung. Hintergrund ist der, dass wahrgenommene Bildinformationen Hypothesen stimulieren, die mit unseren bisherigen Erfahrungen abgeglichen werden, sodass aus den visuellen Reizen schließlich plausible Schlüsse gezogen werden können.
Dies führt sogar so weit, dass fehlende oder fehlerhafte Elemente des Bildinhalts vom Gedächtnis durch Kontextwissen ergänzt, vernachlässigt oder übergangen werden. Die visuelle Datenverarbeitung unterliegt demzufolge neben der Korrektur auch der Selektion und kognitiven Prozessen der Interpretation (cf. ibid. 196sqq.). Besonders deutlich werden die genannten Korrekturmechanismen bei optischen Täuschungen. Betrachtet man die folgende Abbildung, ist unklar, wie viele Beine der dargestellte Elefant hat, obwohl der Rückgriff auf unser Weltwissen eine klare Anzahl an Beinen vorsieht (cf. Abb. 8).
Abb. 8: Optische Täuschung: Wie viele Beine hat der Elefant? (Mißfeldt 2012, http://www.sehtestbilder.de/optische-taeuschungen-illusionen/, 20.3.2013)
Ein erfolgreiches Dekodieren und Interpretieren visueller Reize setzt gleichermaßen voraus, dass bei informationsreduzierten Bildern ausreichend charakteristische Merkmale erkennbar sind, anhand derer auf das Ganze geschlossen werden kann. Im Gegensatz dazu werden bei visueller Reizüberflutung in der Regel nur die Elemente gespeichert, die dem Betrachter interessant und neuartig erscheinen. Aufmerksamkeitserregend sind daher vor allem ungewöhnliche Montagen aus Bildern und/oder Texten, die ihrem herkömmlichen Kontext entrissen wurden, aber dennoch einen Bezug zur eigenen Lebenswelt aufweisen (cf. Sass 2007, 6).
Das Erstellen ungewöhnlicher und irrealer Bildkompositionen ist insbesondere durch Computerprogramme möglich. Oftmals wirkt das Endprodukt so authentisch, dass unklar ist, ob wir unseren Augen trauen können oder ob ihnen ein Streich gespielt wird. Dies gilt für Standbilder, aber auch für animierte Videoproduktionen (cf. Abb. 9).
Abb. 9: Wolkenreiter (N.N.)
Etwaige Techniken der Bildverarbeitung und -manipulation werden insbesondere in der Werbung angewandt, um die Blicke der Zuschauer zu gewinnen. Dabei handelt es sich um ständig wechselnde Reize, wie etwa häufige Schnitte, spezielle Kameratechniken und dynamische Darstellungen seitens der Akteure, die unseren Orientierungsreflex maßgeblich steuern. Im Vergleich zu Texten und Bildern „zeichnet sich […] nur das Filmverstehen durch ein Maximum an Verstehensökonomie und gleichzeitiger Reizabwechslung aus“ (Weidenmann 1988, 94). Die Verarbeitung gemäß dem Prinzip des geringsten Aufwandes ergibt sich aus dem hohen Grad an Stimulation, dem unsere Wahrnehmung ausgesetzt ist.
Für unser Gehirn stellen die genannten Korrektur- und Selektionsmechanismen kaum eine Herausforderung dar, vielmehr ist das Gegenteil der Fall: „das [konzeptgesteuerte] Zusammenspiel von Bildfragmentierung und Bildergänzung gehört für uns zur Routine visueller Alltagskommunikationen“ (Schrader 1998, 32).
Ähnliches gilt für den bei Film und Video parallel zum Sehverstehen stattfindenden Hörprozess. So erfolgt die Bedeutungskonstruktion des Gehörten ebenso durch datengesteuerte top-down und konzeptgesteuerte bottom-up Prozesse. Ihr Zusammenspiel charakterisiert sich zum einen durch den Rückgriff auf Vorwissen und den situativ gegebenen Kontext, zum anderen durch die Analyse und Semantisierung linear abfolgender sprachlicher Signale (cf. Grünewald/Küster 2009, 170).
Hinsichtlich der Aufmerksamkeit des Betrachters wird im Wesentlichen zwischen willkürlicher und unwillkürlicher Aufmerksamkeit unterschieden. Willkürliche Aufmerksamkeit meint das interessengesteuerte intentionale Hinwenden zu Sachverhalten, Themen und Gestaltung, die die Neugierde des Einzelnen wecken. Stoßen wir dagegen auf unerwartete Reize unserer Umwelt, deren Gestaltung durch grelle Farben oder ungewöhnliche Elemente unsere Beachtung findet, ohne dass der Inhalt von persönlichem Belang ist, spricht man von unwillkürlicher Aufmerksamkeit (cf. Sass 2007, 6).
Natürlich kann nicht alles, was wir wahrnehmen, auch aufgenommen, verarbeitet und gespeichert werden. Dementsprechend unterscheidet man in der Fremdsprachendidaktik zwischen dem von außen auf uns einwirkenden Input und dem, was davon verstanden wurde – dem Intake. Bezogen auf das Medium Film umfasst der Begriff des Inputs alle fremdsprachlichen Artikulationen und Beiträge – ungeachtet dessen, ob sie vom Lernenden verstanden wurden oder nicht. Die Bezeichnung Intake beschränkt sich dagegen auf diejenigen Elemente, die vom Rezipienten verstanden wurden und seinen sprachlichen Lernprozess beeinflussen. Bedingt durch die Tatsache, dass selbst kurze Videosequenzen über einen hohen Grad an verbalem sowie nonverbalem Input verfügen, fördert das Zusammenspiel von Bild und Sprache den Übergang vom Input zum tatsächlichen Intake (cf. University of Texas at Austin 2010).
3.3 Lernpsychologische Überlegungen
Von all unseren Sinnesorganen stellen die Augen die vermutlich bedeutendste Verbindung zum menschlichen Gehirn dar. Verglichen mit dem Tast- (8 %) und Hörsinn (3 %) nimmt die visuelle Wahrnehmung mit über zwei Millionen Nervensträngen ganze 30 % des Großhirns ein. Es ist daher kaum verwunderlich, dass der Mensch in der Lage ist, ein Farbbild im Bruchteil einer Sekunde zu erschließen. Burmark (2008, 8) zufolge vollzieht sich die visuelle Wahrnehmung sogar 60.000 Mal schneller als etwa die Verarbeitung eines Texts.
Doch trotz dieser enormen Leistung unseres Gehirns erschließen sich visuelle Eindrücke keineswegs immer von selbst. Stattdessen ist eine visuelle Lesefähigkeit (visual literacy) erforderlich, um Bildreize erfolgreich erfassen und interpretieren zu können. Diese im Zuge der visuellen Wende oftmals als „bildungsrelevante […] Kulturtechnik“ bezeichnete Fähigkeit ist bei Jugendlichen trotz ihrem täglichen Umgang mit visuellen Medien meist nur oberflächlich ausgeprägt (Michler 2011, 141). Folglich muss die Kompetenz der Bildentschlüsselung gezielt geschult werden, sodass „ausgehend von den Sehgewohnheiten der Schüler […] ein sachkritischer Blick auf ein Bild eingeübt und eine reflektierte Auseinandersetzung mit Visualisierungen angebahnt werden“ kann (ibid. 142). Dies erfordert allerdings, wie alle anderen Fertigkeitsbereiche, ein gezieltes Training mittels einer entsprechenden Didaktisierung, denn „systematisches Bildverstehen […] verlangt nicht weniger Wissen und mentalen Aufwand als [beispielsweise] systematisches Lesen“ (Weidenmann 1988, 177). Zur Heranführung und Optimierung des Hör-Seh-Verstehens bewährt sich daher eine Dreiteilung in Aktivitäten vor, während und nach der audiovisuellen Rezeption. Nur so kann der Lerner aktiv mit dem Medium in Verbindung gebracht und passive Rezeption vermieden werden.
Wie dem Begriff zu entnehmen ist, impliziert Hör-Seh-Verstehen neben Sehverstehen immer auch Hörverstehen. Der Verstehensprozess wird für den Rezipienten dahingehend erleichtert, dass unter Heranziehen der visuellen Dimension das Gehörte direkt auf seine Plausibilität verifiziert werden kann. Anhaltspunkte sind Mimik, Gestik, Verhaltensmuster, Umgebung, aber auch die Gesamtsituation als solche. Allerdings konnte empirisch nachgewiesen werden, dass eine Verbesserung der Hörverstehensleistung erst dann gegeben ist, wenn der visuelle Input „den auditiven Input in sinnvoller Weise ergänzt“ (Porsch/Grotjahn/Tesch 2010, 181).
So