Pearsons Chi-Quadrat (Χ2) |
Pearsons Chi-Quadrat
| Was ist Chi-Quadrat? | |
| Wer ist Pearson? | |
| Wozu brauchen wir Chi-Quadrat? |
Die Logik von Chi-Quadrat
| Zusammenhang? | |
| Kein Zusammenhang? | |
| Auf Abstand |
Pearsons Chi-Quadrat (Χ2) |
| Was ist Chi-Quadrat? | |
| Wer ist Pearson? | |
| Wozu brauchen wir Chi-Quadrat? |
| Zusammenhang? | |
| Kein Zusammenhang? | |
| Auf Abstand |
Wie die Bezeichnung des Tests bereits vermuten lässt, gibt es mehr als nur den einen Chi-Quadrat-Test. In diesem WBT soll uns jedoch lediglich Pearsons Chi-Quadrat-Test auf Unabhängigkeit interessieren.
Das hierbei verwendete empirische Chi-Quadrat Χ2emp ist ein sogenanntes Zusammenhangsmaß. Durch das Ermitteln von Χ2emp für unsere Stichprobe n können wir rechnerisch herausfinden, ob ein Zusammenhang zwischen zwei (oder auch mehreren) betrachteten Variablen X und Y besteht. Gleichzeitig stellt Χ2emp auch die Prüfgröße des dazugehörigen Hypothesentest dar.Karl (eigentlich Carl) Pearson wurde im 19. Jahrhundert in England geboren. Er gilt als Begründer der modernen Theorie der mathematischen Statistik, war aber auch in anderen Bereichen tätig, z.B. Eugenik, Germanistik, Politik u. a. Zudem gilt er als Gründer der Biometrik.
In der Statistik ist er besonders für den Korrelationskoeffizienten r bekannt, sein Wirken umfasst jedoch weitaus mehr. So werden ihm u. a. der Chi-Quadrat-Test auf Unabhängigkeit sowie Grundlagen zu Testtheorien wie dem statistischen Hypothesentest zugeschrieben.
Pearson war zudem Mitbegründer des wissenschaftlichen Journals "Biometrika". Außerdem besetzte er als Erster den Lehrstuhl für nationale Eugenik, also die auf Nationalstaaten beruhenden Erbgesundheitslehre, am University College London. Er war also durchaus patriotisch bzw. nationalistisch eingestellt.Viel häufiger ist es in den Sozialwissenschaften jedoch notwendig, zwei (oder mehr) Variablen auf einen Zusammenhang untereinander zu untersuchen. Dies ist die bivariate (bzw. multivariate) Auswertung. Da sich die verschiedenen Skalenniveaus jedoch in Informationsgehalt, Ausprägungen etc. voneinander unterscheiden, können wir zur Untersuchung des Zusammenhangs nicht für alle Skalenniveaus das gleiche Zusammenhangsmaß verwenden.
Das Zusammenhangsmaß Chi-Quadrat und der dazugehörige Chi-Quadrat-Test auf Unabhängigkeit werden verwendet, wenn die beiden Variablen X und Y, die auf einen Zusammenhang untersucht werden sollen, beide Nominalskalenniveau besitzen.Die ganze Zeit ist die Rede vom Zusammenhang zweier Variablen X und Y. Eine Frage ist bisher jedoch noch ungeklärt:
Was bedeutet überhaupt Zusammenhang?
Und wann besteht zwischen
zwei Variablen X und Y ein Zusammenhang?
Ein statistischer Zusammenhang zwischen zwei Variablen X und Y besteht also, wenn diese sich salopp gesagt gegenseitig beeinflussen.
Ein Beispiel: Bei Fluggesellschaften gibt es eine geforderte Mindestgröße, um Pilot/in werden zu können. Diese liegt (je nach Gesellschaft) bei mindestens 1,60 m. Treffe ich nun eine Person, die Pilot/in ist, weiß ich, dass ihre Körpergröße mindestens 1,60 m beträgt, ohne zuvor nachmessen zu müssen.Zwei Ereignisse A und B sind genau dann stochastisch unabhängig, wenn die Wahrscheinlichkeit p ihres gemeinsamen Auftretens gleich ihrem Produkt ist
p(A∩B) = P(A) x P(B) .
Bei Pearsons Chi-Quadrat-Test auf Unabhängigkeit messen wir den Abstand der tatsächlich gemessenen Zellhäufigkeiten von den sogenannten erwarteten Zellhäufigkeiten, die sich aus der Definition der statistischen Unabhängigkeit ergeben und berechnen lassen. Wir betrachten also die Abweichung unserer erhobenen Daten von dem Zustand, der für die statistische Unabhängigkeit nötig wäre.
Dazu berechnen wir für jede Zelle die erwartete Zellhäufigkeit eij. Die tatsächlichen Zellhäufigkeiten nij sind bereits gegeben. Daraus ermitteln wir unser empirisches Chi-Quadrat Χ2emp.
Ist unser Chi-Quadrat Χ2emp > 0, weichen die Zellhäufigkeiten nij von den erwarteten Zellhäufigkeiten eij ab. Sind diese Abweichungen ausreichend groß, können wir nicht mehr annehmen, dass sie nur durch Zufall entstanden sind, sodass wir nicht von einer statistischen Unabhängigkeit der Variablen X und Y ausgehen können. Es besteht also ein Zusammenhang zwischen den beiden Variablen.
Fahren Sie mit der Maus über die Bestandteile der Formel! Wenn Sie auf die hervorgehobenen Teile der Formel klicken, startet eine Audiodatei mit Erklärungen.
| Χ2emp | = | ![]() |
(nij − eij)2 |
| eij |
| Hinweis | × |
Klicken Sie auf das Akkordion links, um weitere Informationen über Chi-Quadrat zu erhalten!
