Der Chi²-Test zur Prüfung kategorialer Merkmale


Chi²-Test

Der Chi²-Test prüft einen Zusammenhang, meist von zwei Merkmalen, die im einfachsten Fall jeweils zweigestuft sind. Mehr Stufen sind möglich, aber schwerer zu interpretieren. Ein Beispiel: 2 Altersgruppen (≤> 65 Jahre) und Rückenschmerzen (ja / nein). Hier würde der Test prüfen, ob es einen Zusammenhang gibt, speziell, ob Rücken mit dem Alter korreliert. Interpretativ würde man das am Ende so sagen (wenn p ≤ 0.05): "je älter desto Rücken".

Tipp: Ersetzen Sie die zwei Merkmale aus dem obigen Beispiel einfach mit zwei Merkmalen aus Ihren eigenen Daten, z.B. Gruppe (A/B) versus Merkmal (ja/nein).

Weitere Beispiele:
Inzidenzraten zweier Gruppen sollen verglichen werden.
Positivraten von zwei diagnostischen Tests sollen verglichen werden.
Präferenzraten zweier Gruppen sollen verglichen werden.

Sie müssen schnell einen Chi²-Test rechnen

Wenn es schnell gehen muss, nehmen Sie Excel, hier ist der Test eingebaut (Funktion "chitest2").

kein Rücken-
problem
Rücken-
problem
≤ 65 Jahre 1010
> 65 Jahre 1050


Geben Sie die 4 Ziffern in die Zellen a1 bis b2 ein, dann geben Sie diese Formel ein

=chitest2(A1:B2)

Das ergibt ein p von 0.003.

Da dieser p-Wert ≤ 0.05, können Sie die Nullhypothese ("kein Zusammenhang") ablehnen, was einen Zusammenhang plausibel macht. Im obigen Beispiel käme man zu dem Schluss, das steigendes Alter mit einer erhöhten Inzidenz von Rückenproblemen einhergeht.

Ein Chi²-Test mit R

Mit R oder RStudio geht es so: Die 4 Ziffern der Tabelle werden erst eingegeben, über eine Matrix, 4 Werte über 2 rows ergibt eine 2 x 2 Tafel:

d = matrix(c(10,10,10,50), nrow = 2)
chisq.test(d, corr = F)

Der p-Wert ist (gerundet) gleich. D.h. die Nullhypothese ("kein Zusammenhang") ist abzulehnen, der Zusammenhang zwischen Alter und Rückenproblemen kann als plausibel bejaht werden.

Ein Chi²-Test mit SPSS

Machen Sie ein Syntax-Fenster auf und kopieen diese Befehlszeilen hinein:

data list list /a (f8) b(f8) faelle (f8).
begin data
1 1 10
1 2 10
2 1 10
2 2 50
end data.
weight by faelle.
cross a by b /stat chi risk.

Dann alles markieren (oder Strg + a), dann die Run-Taste oder Strg + r.


SPSS, R, und andere Apps für die Statistik


SPSS

PSPP als freie Alternative vs. SPSS

R als kostenlose Alternative

R installieren

Weitere Links

SPSS, das Allround-Knife

Der Chi²-Test

Eine ANOVA zur Frage von Gruppenunterschieden (ANOVA = Analysis of Variance)

Der t-Test zur Frage von Gruppenunterschieden

Der t-Test zur Frage, ob sich Messwiederholungen unterscheiden

Der U-Test zur Frage von Gruppenunterschieden

R, ein kostenloses Programm mit starker Verbreitung

Übereinstimmung zweier Methoden graphisch anzeigen lassen (Bland-Altman Plot)

Ein lineares Vorhersagemodell rechnen (eine lineare mulitple Regression)

Eine Korrelation rechnen

Eine Rang-Korrelation (nach Spearman) rechnen

Fragen zusammenfassen (summieren, aggregieren)

Eine mixed ANOVA (Vergleich zwischen Gruppen, die eine Messwiederholung haben) rechnen

Ein Torten-/Kuchen-Diagramm in 3D

Ein Balken-/Histogramm erstellen

Eine deskriptive Statistik erstellen

Eine ordinale Regression rechnen

Eine Inzidenzrate bewerten

Zwei Gruppen im Mittel mittels Python vergleichen (t-Test)

Zwei Gruppen (ohne Rückgriff auf die vielen Voraussetzungen des t-Tests) mittels Python vergleichen (U-Test)

Zwei binäre Reihen auf Änderung prüfen (McNemar-Test)

Eine Verlaufsgraphik von Mittelwerten mit Streubalken

Ein 2D-Kuchen mit ggplot

Eine Inzidenzrate mit R bewerten (passt meine Beobachtete zu der der Population, die ich aus der Literatur kenne?)

Zwei Inzidenzen mit R vergleichen

Eine Rang-Varianzanalyse rechnen, d.h. 2 oder mehr Gruppen vergleichen

Eine Partialkorrelation rechnen, d.h. eine Korrelation (Eiskremverzehr und Sonnenbrand), aus der eine Drittvariable (Sonnenstunden) eliminiert ist

Einen Median-Test rechnen, d.h. weichen 2 Gruppen unterschiedlich stark vom Gesamt-Median ab?

Eine Regession zur Vorhersage bzw. Erklärung von Häufigkeitsdaten rechnen (Poisson-Regresion)