Der Fragebogen. Elisabeth Steiner
„ledig“, „verheiratet“, „verwitwet“ und „geschieden“ ist völlig willkürlich und könnte auch anders gewählt werden. Keinesfalls soll ausgedrückt werden, dass ledige vor den geschiedenen Personen eingestuft werden, weil sie mehr Bedeutung (z. B. gesellschaftliche Akzeptanz) haben. Den Zahlen kommt keinerlei empirische Bedeutung zu. Die Ziffern drücken lediglich eine Ungleichheit bzw. Gleichheit aus.
Ebenso hat die Kategorisierung bei der Variablen „RaucherIn“ für die Zuordnung 1 oder 0 keinerlei empirische Relevanz. Eine Person, die nicht raucht (0), ist nicht „schlechter“ als eine Person, die raucht (1).
Die Zuordnung der Zahlen auf Nominalskalenniveau kennzeichnet unterschiedliche Qualitäten oder Kategorien einer Variablen. Dazu sind zwei Annahmen bei der Zuweisung von Zahlen zu treffen:
1. Exklusivität: Unterschiedlichen Ausprägungen einer Variablen (Merkmal) werden unterschiedliche Zahlen zugeordnet.
2. Exhaustivität: Für jede beobachtete oder potenziell bestehende Merkmalsausprägung existiert eine Zahl (vgl. Rasch & Kubinger, 2006, S. 9).
Nominalskalierte Variablen sind aufgrund ihres niedrigen Skalenniveaus in ihrer Auswertungsmöglichkeit sehr eingeschränkt. Statistische Operationen beschränken sich in der Regel darauf, für verschiedene Merkmalsausprägungen eine Häufigkeitsverteilung darzustellen. Deskriptivstatistische Methoden anderer Art, wie Darstellungen in Diagrammen, sind möglich. Dies wird in der Folge noch genauer demonstriert.
2.3 Ordinalskala
„Eine Ordinalskala ordnet den Objekten eines empirischen Relativs Zahlen zu, die so geartet sind, dass von jeweils 2 Objekten das Objekt mit der größeren Merkmalsausprägung die größere Zahl erhält“ (Bortz, 2005, S. 19).
Beispiele für Variablen und deren Zahlenzuordnungen (Kodierungen)
Rauchgewohnheiten: | 1 = Nichtraucher |
2 = mäßiger Raucher | |
3 = starker Raucher | |
4 = sehr starker Raucher | |
Höchster Schulabschluss: | |
1 = Hauptschule | |
2 = Polytechnischer Lehrgang | |
3 = Fachschule | |
4 = Berufsbildende höhere Schule |
Ein ganz typisches und auch sehr häufiges Beispiel einer ordinalskalierten Variablen ist die Kategorisierung der Altersklassen:
Wie alt sind Sie? | 1 = bis 24 Jahre |
2 = 25 bis 34 Jahre | |
3 = 35 bis 44 Jahre | |
usw. |
Diese Vorgangsweise ist bei der Variablen „Alter“ allerdings eher nicht empfehlenswert, da sie zu einer Reduktion des Informationsgehalts führt. Eine genaue Altersangabe in Jahren wäre sinnvoller, darauf wird noch näher eingegangen.
Wenn wir diese Variablen betrachten, kommt den vergebenen Kodezahlen (1–4) eine empirische Bedeutung zu – sie geben die Ordnungsrelation wieder. Die Variable ist nach ihrer Wertigkeit aufsteigend geordnet: Ein mäßiger Raucher raucht weniger als ein starker Raucher, und der wiederum weniger als ein sehr starker Raucher, wobei über die Differenzen keine Angaben vorliegen.
Variablen, bei denen der verwendeten Kodezahl eine empirische Relevanz hinsichtlich ihrer Ordnung zukommt, nennt man ordinalskaliert, d. h. beispielsweise je größer die Zahl, desto höher die Ausprägung des Merkmals.
Die empirische Relevanz dieser Variablen bezieht sich aber nicht auf die Differenz zweier Kodezahlen. Die Differenz zwischen den Kodezahlen eines Nichtrauchers und eines mäßigen Rauchers einerseits und eines mäßigen Rauchers und eines starken Rauchers andererseits ist jeweils 1, allerdings wird man keinerlei Aussage darüber treffen können, dass dieser Unterschied zwischen einem Nichtraucher und einem mäßigen Raucher einerseits und zwischen einem mäßigen Raucher und einem starken Raucher andererseits gleich ist. Dazu sind die Begrifflichkeiten zu vage und eben in Kategorien gefasst.
Das Wesen ordinalskalierter Daten liegt darin, dass sie vergleichende Aussagen über größer/kleiner oder besser/schlechter und gleich/ungleich zulassen.
Die Ordinalskala inkludiert die Aussagen der Nominalskala (Ungleichheit oder Gleichheit). Zu den erwähnten Annahmen der Exklusivität und Exhaustivität kommt eine weitere hinzu, welche die Eigenart der Ordinalskala kennzeichnet. Es ist dies die Bedingung, dass 3. die gewählten Zahlen Unterschiede einer bestimmten Größe in Bezug auf die Merkmalsausprägungen darstellen (vgl. Rasch & Kubinger, 2006, S. 10).
Neben Häufigkeitsdarstellungen ist auch die Berechnung gewisser statistischer Kennwerte wie etwa des Medians (siehe Kapitel 6.3) möglich. Die Berechnung von Mittelwerten kann in bestimmten Fällen Sinn machen. Auf die Berechnung von Zusammenhängen (Korrelationen) mit anderen Variablen und deren Bedingungen wird später eingegangen (siehe Kapitel 9).
2.4 Intervallskala
Eine Intervallskala ordnet den Objekten eines empirischen Relativs Zahlen zu, die so geartet sind, dass die Rangordnung der Zahlendifferenzen zwischen je 2 Objekten der Rangordnung der Merkmalsunterschiede zwischen je 2 Objekten entspricht“ (Bortz, 2005, S. 21).
Beispiele für Variablen
Intelligenzquotient: IQ 110; IQ 120; IQ 130; hier ist der Unterschied zwischen IQ 110 und IQ 120 ebenso groß wie zwischen IQ 120 und IQ 130 – es sind immer 10 IQ-Punkte.
Temperaturmessung in Grad Celsius: 20 Grad Celsius; 30 Grad Celsius; 40 Grad Celsius; hier gilt dieselbe Zugangsweise – die Abstände sind gleich. Man spricht auch von äquidistanten Abständen.
In diesen Fällen kommt es bei der Eingabe in SPSS nicht zur Zuordnung von Kodezahlen, sondern es werden die einzelnen Werte (z. B. 110, 120, 130) verarbeitet. Diese Vorgangsweise wird bei allen metrischen (intervall- und verhältnisskalierten) Variablen gewählt.
Die oben genannten Werte geben nicht nur eine Rangordnung der beteiligten Personen wieder, sondern der Differenz von zwei Werten kommt auch eine empirische Bedeutung zu. Der Abstand der Zahlen bildet immer den gleichen Qualitätsunterschied in der Merkmalsausprägung ab.
Ein Beispiel hierzu: Wenn Person A einen IQ von 80, Person B einen von 120 und Person C einen von 160 hat, so kann man sagen, dass Person B im Vergleich zu Person A ebenso viel intelligenter ist wie Person C im Vergleich zu Person B, nämlich um 40 IQ-Punkte.
Aber trotz der Werte 80 für Person A und 160 für Person C kann man aufgrund der Konstruktion des IQs nicht sagen, dass Person C doppelt so intelligent wie Person A ist. Das kann damit begründet werden, dass der Bezugspunkt – der absolute Nullpunkt – fehlt.
Rein theoretisch gibt es den Punkt-0-IQ, nur ist er in der Natur nicht auffindbar und auch in der Konstruktion des Intelligenzquotienten nicht umgesetzt. Er ist willkürlich festgelegt, wie auch die Abstände zwischen den IQ-Punkten festgelegt sind.
Variablen, bei denen der Differenz (dem Intervall) zwischen zwei Werten eine empirische Bedeutung zukommt, nennt man intervallskaliert. Die Intervallskala wird in den empirischen Sozialwissenschaften angestrebt und ist sicherlich die am häufigsten verwendete Skala. Oft wird sie auch dadurch erzeugt, dass eigentliche Ordinalskalen durch die Erhöhung der Kategorien der Antwortformate zur Intervallskala werden, was methodisch nicht korrekt, aber leider gängige Praxis ist.
„Daten, die Differenzbildung