3 unabhängige Stichproben mit SPSS testen

Hallo,

ich möchte gerne drei unabhängige Gruppen miteinander bezüglich Häufigkeiten vergleichen.

Da geht ja auch der chi2-Test als k x 2 - Erweiterung und ich weiß dann, ob es global überhaupt irgendeinen Unterschied zwischen mindestens 2 Gruppen gibt (wobei ich gelesen habe, dass selbst dann 2 Gruppen sich signifikant unterscheiden können, wenn der globale Test nicht signifikant ausfällt, hängt vielleicht mit den Freiheitsgeraden zusammen).
Wie kann ich am besten herausfinden, welche Gruppen genau sich unterscheiden? Ich habe drei prinzipielle Möglichkeiten gefunden:

  1. Ich habe bei „Bortz, Lienert, Boehnke: Verteilungsfreie Methoden in der Biostatistik“ gelesen, dass man die 3x2-Feldertafel in mehrere 2x2 Feldertafeln aufteilen kann. Ich habe das aber nicht ganz verstanden und es scheint mir, als müsse man alles alles per Hand machen.
  2. Drei Einzel-Chi2-Test mit alpha-Fehlerkorrektur? Aber wie am besten in SPSS machen, muss ich Bonferoni per Hand das alpha korrigieren (alpha/3) oder geht auch autmoatisch und weniger konservativ z.B. Holm?
  3. Binäre logistische Regression: Dort wird ja auch zu Beginn ein globaler Chi2-Test gemacht, wo auch derselbe Wert rauskommt wie bei dem normalen Chi2-Test. Ich erhalte dann für jede der Gruppen ein OR und kann anhand der KI sehen, welche der drei Gruppen sich unterscheiden.
    Die

Die 3. Variante klingt für mich eigentlich am einfachsten durchzuführen, aber ist es legitim, die logistische Regression für diese Fragestellung anzuwenden?

Welche Methode ist zu empfehlen und welche ist praktikabel mit SPSS? Meine SAS-Lizenz ist leider ausgelaufen…

Ich wäre sehr dankbar für Beiträge!
Viele Grüße!

Hi smartinus,

ich möchte gerne drei unabhängige Gruppen miteinander
bezüglich Häufigkeiten vergleichen.

Absoluten oder relativen?

Da geht ja auch der chi2-Test als k x 2 - Erweiterung und ich
weiß dann, ob es global überhaupt irgendeinen Unterschied
zwischen mindestens 2 Gruppen gibt (wobei ich gelesen habe,
dass selbst dann 2 Gruppen sich signifikant unterscheiden
können, wenn der globale Test nicht signifikant ausfällt,

Stimmt soweit.

hängt vielleicht mit den Freiheitsgeraden zusammen).

Jein. In Kurzform: Es werden andere Sachen getestet. Wenn du dich einlesen willst: „Statistical misconceptions“ von Huck, 2009, page 211ff, oder http://www.pitt.edu/~wpilib/statfaq/97postho.html

Wie kann ich am besten herausfinden, welche Gruppen genau sich
unterscheiden? Ich habe drei prinzipielle Möglichkeiten
gefunden:

Knick die ersten beiden. Das ist etwas überholt, so etwas zu machen.

  1. Binäre logistische Regression: Dort wird ja auch zu Beginn
    ein globaler Chi2-Test gemacht, wo auch derselbe Wert
    rauskommt wie bei dem normalen Chi2-Test.

Was auch einen Sinn ergibt. Denn es wird wieder ein Globaltest gemacht, ob der Faktor einen Einfluss hat. Da du aber an Vergleichen interssiert bist, kann dir der egal sein.

Ich erhalte dann für
jede der Gruppen ein OR und kann anhand der KI sehen, welche
der drei Gruppen sich unterscheiden.

Korrekt. Wenn SPSS das nicht von selber adjustiert, musst du das alpa entsorechend vorher anpassen. Besser als der klassische Holm ist in dem Fall der Sidak (Seite 70 von http://books.google.at/books?id=3jpvrEhozGgC&pg=PA71…): adjusted alpha = 1-(1-alpha)^(1/n). Zu beachten ist nur, dass für die KI vom OR gelten muss, dass 1 nicht enthalten ist, weil man eine ratio betrachtet.

Die 3. Variante klingt für mich eigentlich am einfachsten
durchzuführen, aber ist es legitim, die logistische Regression
für diese Fragestellung anzuwenden?

Durchaus, wenn du relative Häufigkeiten verwendest (quasi als Punktschätzer für die W’keit in einer Gruppe zu sein).
Ausserdem kannst du weitere Faktoren einschliessen.

Grüße,
JPL

Hallo und danke für die guten Hinweise,
ich vergleiche tatsächlich relative Häufigkeiten.
Logistische Regression ist für mich gut durchführbar.

Zu beachten ist nur, dass
für die KI vom OR gelten muss, dass 1 nicht enthalten ist,
weil man eine ratio betrachtet.

Soweit klar. Noch zum Verständnis: Angenommen ich erhalte für meine drei Gruppen folgende OR [KI]:
Gruppe 1: Ref
Gruppe 2: OR=2 [1,7;2,5]
Gruppe 3: OR=3 [2,6;3,7]
Gruppe 1 unterscheidet sich also sowohl von Gruppe 2 und Gruppe 3. Kann ich auch schlussfolgern, dass sich Gruppe 2 von Gruppe 3 unterscheidet, weil sich die KI nicht überlappen? Und im umgekehrten Fall (KI überlappen sich) könnte ich folgern, dass sich Gruppen 2 und 3 nicht signifikant unterscheiden?

Eine weitere Frage zum Vergleich dreier unabhängiger Stichproben:
Wenn ich Mittelwerte vergleichen will und NormV ist nicht gegeben, sollte ich doch Kruskal-Walls nehmen? (ANOVA ist zwar robust gegen Verletzungen der NormV-Annahme, aber wird von meinem Betreuer wohl nicht akzeptiert). Wie kann ich dann anschließend herausfinden, welche Gruppen sich genau voneinander unterscheiden? Ich habe bei SPSS für Kruskal-Wallis keine Möglichkeiten gefunden, Post-hoc-Tests zu rechnen (welcher Post-hoc-Test wäre überhaupt der geeignetste?) Gibt es da Möglichkeiten?

Oder gibt es außer Kruskal-Wallis noch eine andere Alternative? Es geht bei dieser Fragestellung darum, das Alter des Erstkonsums von Alkohol zwischen drei Gruppen von Jugendlichen zu vergleichen.

Hi smartinus,

Soweit klar. Noch zum Verständnis: Angenommen ich erhalte für
meine drei Gruppen folgende OR [KI]:
Gruppe 1: Ref
Gruppe 2: OR=2 [1,7;2,5]
Gruppe 3: OR=3 [2,6;3,7]
Gruppe 1 unterscheidet sich also sowohl von Gruppe 2 und
Gruppe 3. Kann ich auch schlussfolgern, dass sich Gruppe 2 von
Gruppe 3 unterscheidet, weil sich die KI nicht überlappen? Und
im umgekehrten Fall (KI überlappen sich) könnte ich folgern,
dass sich Gruppen 2 und 3 nicht signifikant unterscheiden?

Nein. Man kann relativ simpel zeigen, dass sich überlappende KIs indifferent sind, was die Hypothese angeht. Vergleiche hierzu: „Statistical rules of thumb“, van Belle, chapter 2.6 oder simulier es selber aus. Am besten man berechnet einfach immer das KI für die diff/ratio.
die ORs haben halt den Nachteil, dass man nich so leicht alles mit allem vergleichen kann. Du kannst aber die Referentkategorie jedes Mal ändern.

Wenn ich Mittelwerte vergleichen will und NormV ist nicht
gegeben, sollte ich doch Kruskal-Walls nehmen? (ANOVA ist zwar
robust gegen Verletzungen der NormV-Annahme, aber wird von
meinem Betreuer wohl nicht akzeptiert). Wie kann ich dann
anschließend herausfinden, welche Gruppen sich genau
voneinander unterscheiden? Ich habe bei SPSS für
Kruskal-Wallis keine Möglichkeiten gefunden, Post-hoc-Tests zu
rechnen (welcher Post-hoc-Test wäre überhaupt der
geeignetste?) Gibt es da Möglichkeiten?

Die Robustheit der Tests sit immer so eine Sache. Da streiten sich die Gelehrten immer. Bei drei Tests kannst du einfach aus einenm Mann-Witney umsteigen, alle Kombis auswerten und adjustieren. Auch hier ist keine Konsonanz von Kruskal-MW gegeben.

Oder gibt es außer Kruskal-Wallis noch eine andere
Alternative? Es geht bei dieser Fragestellung darum, das Alter
des Erstkonsums von Alkohol zwischen drei Gruppen von
Jugendlichen zu vergleichen.

Alter und Erstkonsum klingen eiher nach einer (fälschlicherweise benannten) survival analysis - richtiger heisst das Ding „tie to ebent analysis“ Hier gibt es nicht-parametrischen Ansatz via log-rank-Test (http://en.wikipedia.org/wiki/Logrank_test) oder den legenadären Klassiker: Cox-propoprtional hazard-model (http://en.wikipedia.org/wiki/Proportional_hazards_mo…). eine gute Übersicht über den Kram findet sich im Kleinbaum (http://www.amazon.com/Survival-Analysis-Self-Learnin…).

Grüße,
JPL

1 Like