Forschungsmethoden und Statistik für die Soziale Arbeit. Mathias Blanz
spricht man von Parametern (engl. »population parameters«), die mittels griechischer Buchstaben abgekürzt werden (z. B. wird für den Mittelwert einer Population der Buchstabe μ verwendet; sprich »Mü«).
Sobald die Grundgesamtheit, auf die sich die Untersuchungshypothese bezieht, nicht vollständig rekrutierbar (erreichbar) ist (z. B. weil sie zu umfangreich ist, der dazu notwendige Aufwand nicht geleistet werden kann, die Personen schwer aufzufinden oder wenig motiviert sind usw.), ist es notwendig, eine Stichprobenziehung vorzunehmen (sog. Teilerhebung). Eine Stichprobe (engl. »sample«) bezeichnet eine Teilmenge von MerkmalsträgerInnen einer Grundgesamtheit. Anstelle einer kompletten Volkszählung kann beispielsweise auf den Mikrozensus zurückgegriffen werden, bei dem in Deutschland vierteljährlich 0.1 % bzw. jährlich 1 % aller Haushalte befragt werden (siehe Ostermann & Wolf-Ostermann, 2012). Die Anzahl der Personen einer Teilerhebung wird durch ein kleines n gekennzeichnet (es kommt allerdings gelegentlich vor, dass in einem Text die Gesamtstichprobe mit N und Untergruppen durch n gekennzeichnet werden, um Stichproben- und Gruppengröße voneinander abzuheben). Bei Stichprobenkennwerten (z. B. Mittelwerten) spricht man von Statistiken (engl. »sample statistics«), die üblicherweise durch lateinische Buchstaben abgekürzt werden (z. B. wird für den Mittelwert einer Stichprobe das Zeichen
Bei Teilerhebungen, die in den Sozialwissenschaften wesentlich häufiger anzutreffen sind als Vollerhebungen, ist von den Daten der Stichprobe auf die Population zu schließen, denn es gilt: n < N. Dies bedeutet, dass die Daten einer Stichprobenuntersuchung die Population nicht immer exakt abbilden. Diese unvermeidbaren Unterschiede zwischen Grundgesamtheit und Stichprobe werden als Stichprobenfehler (oder Standardfehler) bezeichnet. Der Stichprobenfehler gibt an, wie genau Parameter der Population durch die Statistiken der Stichprobe geschätzt werden können (die mathematische Berechnung des Standardfehlers wird in Kapitel 6 beschrieben). Stichproben kann man insbesondere hinsichtlich zweier Gesichtspunkte voneinander unterscheiden: die Art, wie sie ausgewählt werden, und ihre jeweilige Größe (der Stichprobenumfang).
Differenzierung von Stichprobenarten
Man kann zunächst zwischen nichtzufallsbasierten und zufallsbasierten Auswahlverfahren unterscheiden. Während die Ziehung bei der nichtzufallsbasierten Auswahl (sog. nichtprobabilistische Stichproben) auf einer gezielten (nicht beliebigen) Auswahlstrategie (z. B. über Bekanntschaft, Gelegenheit) basiert (wodurch einige Personen der Population eine größere Chance zur Auswahl aufweisen als andere), wird bei der zufallsbasierten Auswahl (sog. probabilistische Stichproben) dazu ein Zufallsverfahren (z. B. Los) verwendet (womit jede Person die gleiche Auswahlwahrscheinlichkeit aufweist). Nichtprobabilistische Stichproben sind eher bei explorativen Untersuchungen angemessen, während probabilistische Stichproben für deskriptive und explanative Studien notwendig erscheinen. Zum zweiten kann zwischen ungeschichteten und geschichteten Stichproben differenziert werden. Bei einer ungeschichteten Stichprobe wird bei der Auswahl ausschließlich das Populations-definierende Merkmal berücksichtigt (z. B. Studierende der Sozialen Arbeit), während bei einer geschichteten Stichprobe zusätzlich darauf geachtet wird, dass die Stichprobe (neben dem Populations-definierenden Merkmal) hinsichtlich weiterer Merkmale, die einen potentiellen Einfluss auf die abhängige Variable aufweisen könnten (wie z. B. Geschlecht, sozioökonomischer Status usw.), der Population (weitgehend) entspricht (z. B. 75 % weibliche und 25 % männliche Studierende der Sozialen Arbeit). Schichtungsverfahren dienen somit der Verbesserung der Repräsentativität einer Stichprobe. In Abbildung 3 ist ein Beispiel für hoch und niedrig repräsentative Stichproben gegeben: Befinden sich in der Grundgesamtheit 75 % Frauen und 25 % Männer (linke Seite), ist eine Stichprobe mit 3 Frauen und 1 Mann repräsentativ (oben), eine Stichprobe mit 2 Frauen und 2 Männern (unten) jedoch nicht. Bestünde die Population hingegen aus gleich vielen Frauen (50 %) wie Männern (50 %) (rechte Seite), dann wäre eine Strichprobe mit 2 Frauen und 2 Männern (oben) repräsentativ, eine mit 3 Frauen und 1 Mann (unten) aber nicht mehr. Repräsentativität bezeichnet also das Ausmaß, in der eine Stichprobe in ihrer Zusammensetzung der Population ähnelt. Eine Stichprobe ist spezifisch repräsentativ, »wenn ihre Zusammensetzung hinsichtlich einiger relevanter Merkmale der Populationszusammensetzung entspricht« (Bortz & Döring, 2006, S. 397), bzw. global repräsentativ, »wenn ihre Zusammensetzung in nahezu allen Merkmalen der Populationszusammensetzung entspricht« (ebd., S. 398).
Abb. 3: Hoch- und niedrigrepräsentative Stichproben
Aus diesen Überlegungen resultieren vier unterschiedliche Arten von Stichproben, die in Tabelle 2 aufgeführt sind. Bei einer Gelegenheitsstichprobe (oder anfallenden Stichprobe; engl. »convenience sample«) werden alle Personen, die sich z. B. freiwillig für eine Untersuchungsteilnahme bereit erklären, ohne weitere Selektion in die Studie aufgenommen (z. B. wenn für eine Pilotstudie zur Wirksamkeit eines neuen Trainingsprogrammes zur vorschulischen Förderung alle Kinder eines bestimmten Kindergartens X, deren Eltern eine Teilnahme bewilligt haben, verwendet werden). Ein solches Vorgehen erscheint in Hinblick auf die Generalisierbarkeit der Befunde problematisch, da bekannt ist, dass sich Personen, die sich für eine Untersuchung zur Verfügung stellen, von denen, die die Teilnahme verweigern, systematisch unterscheiden (z. B. bezüglich Schulnoten, sozialem Status, Geselligkeit usw.; Rosenthal & Rosnow, 1975). Das Vorgehen kann verbessert werden, indem die Kinder per Zufall auf die Versuchsbedingungen (»ohne Training« und »mit Training«) aufgeteilt und Replikationsuntersuchungen (Wiederholungsstudien) an weiteren Stichproben durchgeführt werden.
Tab. 2: Vier Arten von Stichproben (nach Huber, 2009)
Stichprobe ohne ZufallsauswahlStichprobe mit Zufallsauswahl
Eine zusätzliche Qualitätsverbesserung bei fehlender Zufallsauswahl kann dadurch erzielt werden, dass für bestimmte Merkmale (wie z. B. Geschlecht oder Alter), die man für untersuchungsrelevant hält, Quoten festgelegt und diese bei der Ziehung berücksichtigt werden (sog. Quotenstichprobe). »Bei der Quotenstichprobe wird versucht, die Zusammensetzung der Stichprobe hinsichtlich ausgewählter Merkmale den Populationsverhältnissen durch bewusste Auswahl ›passender‹ Objekte anzugleichen, also quasi ›Quoten‹ für bestimmte Merkmale zu erfüllen« (Bortz & Döring, 2006, S. 402). Dazu ist es allerdings notwendig, dass Informationen über diese Quoten in der Population bekannt sind (z. B. aus amtlichen Statistiken). Ein Beispiel wäre: Da der Kindergarten X (Stichprobe) aufgrund seiner Lage überproportional viele Kinder mit Migrationshintergrund im bundesweiten Vergleich (Population) aufweist, wird von diesen Kindern nur ein Teil in die Studie aufgenommen.
Als weiteres nichtprobabilistisches Auswahlverfahren sei noch auf die sog. theoretische Stichprobe hingewiesen. Diese spielt insbesondere in der qualitativen Sozialforschung eine große Rolle und bezeichnet ein Vorgehen, bei dem die Forschenden auf der Grundlage theoretischer Vorüberlegungen typische und/oder untypische Fälle gezielt auswählen. Aufbauend auf dem Konzept der »exemplarischen Verallgemeinerung« (Wahl, Honig & Gravenhorst, 1982, S. 206) dienen dabei »detaillierte Einzelfallbeschreibungen, die ›repräsentativ‹ sind, wenn sie als typische Vertreter einer Klasse ähnlicher Fälle gelten können« (Bortz & Döring, 2006, S. 335), als Ausgangspunkt. Dies bedeutet auch, dass noch während der Datenerhebung neue (ähnliche oder kontrastierende) Fälle mit aufgenommen (oder ggf. ausgeschlossen) werden können. Eine Schwierigkeit dabei ist jedoch, dass unklar bleibt, wie Forschende einen typischen Fall erkennen können, ohne bereits über eine »Theorie« zu verfügen. Eine nachfolgende quantitative Untersuchung zur Überprüfung der Befunde solcher Studien erscheint deshalb notwendig.
Für zufallsbasierte Stichproben differenziert Tabelle 2 zwei Arten von Auswahlverfahren. Bei Zufallsstichproben wählt der Forschende nach dem Zufallsprinzip einzelne Merkmalsträger aus der Grundgesamtheit