Der Fragebogen. Elisabeth Steiner
von der sie auf die Grundgesamtheit der Bevölkerung schließen können.
Repräsentativität bedeutet in diesem Beispiel, dass die „kleine“ ausgewählte Gruppe möglichst die reale Situation der „Grundgesamtheit“ beschreibt, also die Variablen (Eigenschaften), wie z. B. Geschlecht, Alter, Ausbildungsstand, soziale Schicht usw., real abgebildet sind.
Natürlich sind Ergebnisse, die aufgrund von Daten einer Stichprobe gewonnen werden, mit Ungenauigkeiten behaftet. Das ist auch der Grund, weshalb bei einer Wahlprognose stets ein Bereich angegeben wird, z. B. +/–2 %, in dem das „wahre“ Ergebnis (also der An teil der WählerInnen an der Grundgesamtheit) mit gewisser Wahrscheinlichkeit liegt.
Neben den Ergebnissen, die durch analytische Verfahren gewonnen werden, können deskriptivstatistische zusätzlich zu einer übersichtlichen und anschaulichen Informationsaufbereitung beitragen.
Das Zusammenspiel der beiden Methoden kann sich gut ergänzen und zu einem Höchstmaß an Information führen.
Die Inferenzstatistik wird häufig auch als analytische Statistik oder schließende Statistik bezeichnet. Der wesentliche Unterschied zur deskriptiven Statistik liegt darin, dass es zur Überprüfung von Hypothesen, die sich auf die dahinterstehende Grundgesamtheit beziehen, kommt. Auf diese Weise sollen allgemein gültige Aussagen über die Stichprobe hinaus getroffen werden. Es wird ein deduktiver Zugang verfolgt.
1.2 Stichprobenarten
In der Empirie (wissenschaftlich gewonnene Erfahrung) werden unterschiedliche Zugänge zur Auswahl einer repräsentativen Stichprobe verfolgt. Mittels eines Stichprobenplans wird das Zufallsverfahren festgelegt, um repräsentative Elemente zu ziehen.
Der Begriff „Stichprobe“ bezeichnet eine kleine Teilmenge der sogenannten Grundgesamtheit, deren Auswahl nach bestimmten Kriterien erfolgen sollte, um verallgemeinerbare Aussagen treffen zu können.
Die Ziehung einer Stichprobe hat einen sehr pragmatischen Ursprung, nämlich jenen, dass die Befragung der Grundgesamtheit (Vollerhebung, z. B. der österreichischen Gesamtbevölkerung) nicht (oder nur sehr aufwendig) möglich ist und den Rahmen einer Untersuchung meist sprengen würde. Allerdings ist bei sozialwissenschaftlichen Fragen anzunehmen, dass gezogene Stichproben auch unter sehr guten Überlegungen und Bedingungen die Verteilung der Merkmale in der Population nicht exakt abbilden. Man müsste im Vorfeld bereits exakte Angaben über Verteilungen und Merkmalsausprägungen haben, was in der Realität kaum gegeben ist. Nichtsdestotrotz ist der grundsätzliche Zugang bei der Ziehung von Stichproben das sogenannte Induktionsprinzip (vom lateinischen inductio, Hineinführen), bei dem vom besonderen Fall auf den allgemeinen geschlossen wird.
„Unter Grundgesamtheit ist diejenige Menge von Individuen, Fällen, Ereignisse zu verstehen, auf die sich die Aussagen der Untersuchung beziehen sollen und die im Hinblick auf die Fragestellung und Operationalisierung vorher eindeutig abgegrenzt werden muss“ (Kromrey, 2009, S. 255).
Beispiele für Grundgesamtheiten sind: alle BewohnerInnen von Wien, alle RaucherInnen einer Zigarettenmarke in Österreich, alle RechtshänderInnen, alle ostösterreichischen StudentInnen einer bestimmten Studienrichtung etc.
Eine gezogene Stichprobe sollte die Grundgesamtheit möglichst genau abbilden. Je besser diese kleine Teilmenge die Grundgesamtheit abbildet, desto präzisere Aussagen können über sie gemacht werden. Dies stellt jedoch eine gewisse Herausforderung dar, denn die Repräsentativität in allen Merkmalen kann in den seltensten Fällen im statistischen Sinne erfüllt werden, besonders dann, wenn die Untersucherin/der Untersucher keinerlei Hinweise auf die Verteilung der relevanten einzelnen Variablen in der Stichprobe hat.
Neben der Art und Weise, wie die Stichprobe gezogen (zufallsgesteuert bzw. nicht zufallsgesteuert) wird, ist natürlich auch deren Größe von Bedeutung. Im Allgemeinen kann jedoch eine auch noch so große Stichprobe gravierende Fehler bei der Stichprobenziehung nicht wettmachen. Möchte man beispielsweise etwas über das Durchschnittseinkommen der StudentInnen wissen und befragt dazu fünftausend Studierende, wird man stark verzerrte Ergebnisse erhalten, wenn diese fünftausend Personen zum Großteil nebenberuflich studieren, also vollwertige Einkommen haben. Diese Stichprobe wäre nicht repräsentativ für „die StudentInnen“, wenn diese zum Großteil eben nicht nur nebenberuflich studieren. Es würde zu einem „Bias“ kommen, einer systematischen Verzerrung. Die Stichprobe müsste, um zu sinnvollen Schlussfolgerungen zu kommen, so gezogen werden, dass sie die realen Verhältnisse gut abbildet – eine Vorerhebung der Verteilungen wäre unerlässlich.
An dieser Stelle sollen nun die in den Sozialwissenschaften gängigen Stichprobenarten dargestellt werden. Ein besonderes Augenmerk liegt dabei auf der Zufallsstichprobe, welche die häufigste Variante darstellt.
1.2.1 Einfache Zufallsstichprobe (Random Sample)
Liegen, wie oben erwähnt, keinerlei Hinweise auf die Verteilung relevanter Variablen in der Grundgesamtheit vor, empfiehlt sich die Ziehung einer Zufallsstichprobe (Random Samples), denn bei dieser Stichprobe hat dann jedes Merkmal die gleiche Wahrscheinlichkeit, in die relevante Stichprobe gezogen zu werden.
„Eine Zufallsstichprobe ist dadurch gekennzeichnet, dass jedes Element der Grund gesamtheit mit gleicher Wahrscheinlichkeit ausgewählt werden kann“ (Bortz, 2010, S. 87).
Man spricht in diesem Fall von einer reinen (einfachen) Zufallsstichprobe (Simple Random Sample). Die Wichtigkeit dieser Stichprobenziehung in den Sozialwissenschaften muss besondere Beachtung erhalten. Es ist dies oft die einzige Möglichkeit des Zugangs.
1.2.2 Geschichtete Zufallsstichprobe
Eine weitere Möglichkeit wäre es, eine geschichtete (stratifizierte) Zufallsstichprobe zu ziehen. Dabei wird die Stichprobe anhand einer ausgewählten Schichtungsvariable in einander nicht überschneidende Schichten geteilt. Diese Schichten sollten in sich ziemlich homogen sein, untereinander aber sehr unterschiedlich. Aus diesen Segmenten zieht man dann eine Zufallsstichprobe. Diese Vorgangsweise macht natürlich nur dann Sinn, wenn die Schichtungsvariable einen hohen Zusammenhang mit dem eigentlich interessierenden Untersuchungsmerkmal hat. Man muss über die Verteilung der Merkmale in der Grundgesamtheit Bescheid wissen, um eine repräsentative Stichprobe erzeugen zu können. Die so gezogene Stichprobe wird als geschichtet oder stratifiziert bezeichnet (vgl. ebd., S. 88). Ein Beispiel: Wenn das Freizeitverhalten Jugendlicher untersucht werden soll, muss bei der Ziehung der Stichprobe auf Alter, Taschengeldhöhe, Stadt/Land, Geschlecht etc. geachtet werden. Aus diesen einzelnen Schichten (Strata; Sg. Stratum) werden dann zufällig Jugendliche gezogen, also aus der Gruppe Stadt/Land, der Gruppe Taschengeldhöhe usw.
Bei der stratifizierten Zufallsstichprobe muss bekannt sein, welche Faktoren die Verteilung des untersuchten Merkmals beeinflussen, um eine geeignete Auswahl treffen zu können.
1.2.3 Klumpenstichprobe (Cluster Sample)
In der praktischen Arbeit mit Daten kommt es immer wieder vor, dass vorgruppierte Teilmengen der Grundgesamtheit vorliegen. Man spricht in diesem Fall von sogenannten Klumpenstichproben, diese werden neben den geschichteten Stichproben ebenfalls den mehrstufigen Zufallsstichproben zugeordnet. Klumpenstichproben sind dann sinnvoll, wenn die Elemente der Grundgesamtheit nicht erfasst werden können, aber Informationen darüber vorhanden sind, wo diese Elemente gefunden werden können. Ein Beispiel: Es gibt keine Listen darüber, welche und wie viele Wiener PatientInnen an Bluthochdruck leiden. Aber Spitäler führen Aufzeichnungen über ihre eigenen PatientInnen, und so könnte man eine bestimmte Anzahl an Wiener Spitälern (das wären die „Klumpen“ oder „Cluster“) auswählen und aus diesen Clustern Zufallsstichproben von Bluthochdruck-PatientInnen ziehen.
„Eine Klumpenstichprobe besteht aus allen Untersuchungsteilnehmern, die sich in mehreren, zufällig ausgewählten Klumpen befinden“ (Bortz, 2010, S. 87).
Diese Klumpenstichproben müssen allerdings von Ad-hoc-Stichproben (anfallenden Stichproben) differenziert werden – es müssen mehrere zufällig ausgewählte Klumpen vollständig untersucht werden. Ad-hoc-Stichproben wären eine Schulklasse, eine Seminargruppe, Kranke auf einer Station im Krankenhaus. Bei diesen anfallenden Stichproben wird ohne spezielle Planung und ohne genaue Kenntnis der Merkmalsausprägungen