Chi-Quadrat-Anpassungstest

Problemstellung:

Ich möchte mit einem Chi-Quadrat-Anpassungstest testen, ob eine empirische von einer theoretischen Häufigkeitsverteilung ordinaler Klassen verschieden ist.

Voraussetzung zur Anwendung des Chi-Quadrat-Anpassungstests ist, dass die erwartete Häufigkeit in jeder Klasse nie kleiner als 1 und in weniger als 20% der Klassen kleiner 5 ist. Das ist leider nicht der Fall.

Zwei Möglichkeiten:
a) Klassen, in denen die erwarte Häufigkeit zu gering ist weglassen. Nachteil: Informationsverlust.
b) Klassen mit geringer erwarteter Häufigkeit zusammenfassen. Nachteil: Ausgleichende Wirkung (wenn man z.B. zwei Klassen zusammenfasst, von denen eine nach oben und eine nach unten abweicht).

Danke für eure Ideen/Infos!

Hallo Jan,

hast Du schon einmal daran gedacht, als Alternative zum Chi-Quadrat-Test den Kolmogorov-Smirnov-Test anzuwenden:

http://de.wikipedia.org/wiki/Kolmogorow-Smirnow-Test

Es gibt zudem noch andere Alternativ-Tests. Vielleicht informierst Du Dich auch über sie:

http://www.wer-weiss-was.de/cgi-bin/forum/showarchiv…

Grüße,

Oliver Walter

Hi,

um dein Problem sauber zu lösen, rate ich dringend zum Einsatz geeigneter Software.
Es gibt Modifikationen des Chi2 Tests, die Häufigkeiten von 1 oder sogar 0 zulassen.
Stichwörter: Haldane-Dawson oder Craddock-Flood.

Gruss,

Hi Jan,

nun gebe ich auch noch meinen Senf dazu…

  • Die Teststatistik des Chiquadrat-Tests ist nur asymptotisch chiquadrat-verteilt, daher die von dir aufgeführten Restriktionen. Es ist möglich, aber rechenaufwändig, die exakte Verteilung der Teststatistik zu bestimmen. Ihre (diskrete) Verteilung basiert auf der Multinomialverteilung.

  • Der Kolmogorow-Smirnow-Test unterstellt eine stetige Verteilung der Grundgesamtheit, die in deinem Fall - vermute ich - nicht gegeben ist. Man kann ihn dann zwar verwenden, seine Güte ist aber geringer, d.h. er ist konservativ (lehnt H0 nicht so schnell ab).

  • weitere mögliche Anpassungstests sind der Test von Anderson-Darling (eine Art Verallgemeinerung des K-S-Tests, schneidet nach Büning-Trenkler in Gütevergleichen am besten ab), der Cramèr-Mises-Smirnow-Test, der Test von Sherman, der Test von Riedwyl und der Test von David.

Man kann mit Hilfe dieser Tests nicht nur auf Normalverteilung testen sondern generell, ob eine empirische Verteilung mit einer (vollständig spezifizierten) hypothetischen Verteilung übereinstimmt. Meines Wissens liefert nur der Chiquadrat-Test auch dann exakte kritische Bereiche, wenn die Verteilung nicht vollständig spezifiziert ist, d.h. keine Parameter zu schätzen sind.

Ausführliche Informationen dazu findest du in H.Büning, G. Trenkler: Nichtparametrische statistische Methoden, de Gruyter, 2. Auflage, 1994.

Letztlich kommt es darauf an, wie exakt deine Ergebnisse sein müssen und (Vorsicht! Hier kommt die praxisorientierte Sichtweise, nicht die wissenschaftliche!) ob dir Aussagen in Richtung H0 oder H1 lieber sind.

Gruß
Katharina

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo Katharina, hallo Helge, hallo Oliver!

zuerst mal vielen Dank für eure Hilfe. Bin echt begeistert über das Feedback!
Ich habe mich dann heute auch intensiver mit dem Kolmogorow-Smirnov-Test beschäftigt. Mir ist dabei nicht klar geworden, warum die erwartete Häufigkeit der i-ten Klasse mit der beobachteten Häufigkeit der (i-1)-ten Klasse verglichen wird. Aber vielleicht liegt es daran, dass (wie du vermutet hast) meine theoretische Verteilung diskret ist. Ich habe die Verteilungen unten angegeben, falls es wichtig ist.

Und noch mal ja: weder mit dem Kolmogorow-Smirnov-Test noch mit dem Chiquadrat-Test konnte ich H0 ablehnen. Das ist so auch in Ordnung, denn korrekt, aber es wäre mir ein wenig lieber gewesen, mit H1 weiter zu arbeiten.

Den Büning-Trenkler habe ich mir auf euer Anraten mal aus der Bib bestellt. Werde ich schlau daraus, als Nicht-Mathematiker?

Viele Grüße

Jan

Ich habe 7 ordinale Klassen und 36 Beobachtungen

(beobachtete Häufigkeit und theoretische Wahrscheinlichkeit):
Klasse 1: 5 - 0,0878
Klasse 2: 7 - 0,2634
Klasse 3: 13 - 0,3292
Klasse 4: 8 - 0,2195
Klasse 5: 3 - 0,0823
Klasse 6: 0 - 0,0165
Klasse 7: 0 - 0,0014

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo Jan,

na, es macht ja auch Spaß zu helfen!

Kolmogorow-Smirnov-Test beschäftigt. Mir ist dabei nicht klar
geworden, warum die erwartete Häufigkeit der i-ten Klasse mit
der beobachteten Häufigkeit der (i-1)-ten Klasse verglichen
wird. Aber vielleicht liegt es daran, dass (wie du vermutet
hast) meine theoretische Verteilung diskret ist.

Hm, die Teststatistik beim zweiseitigen K-S ist doch sup|F_0(x) - F_n(x)| mit F_0 theoretische, F_n empirische Verteilungsfunktion. Deswegen weiß ich jetzt nicht ,wie du darauf kommst.

Und noch mal ja: weder mit dem Kolmogorow-Smirnov-Test noch
mit dem Chiquadrat-Test konnte ich H0 ablehnen. Das ist so
auch in Ordnung, denn korrekt, aber es wäre mir ein wenig
lieber gewesen, mit H1 weiter zu arbeiten.

Ok, hast du auch mal den einseitigen K-S-Test durchgeführt? (Ich habe es nicht mit deinen Daten gerechnet, aber das fällt mir spontan ein.) Zwar glaube ich allein vom Hinschauen, dass der auch nicht ablehnen wird. Aber eine weitere Möglichkeit wäre - wenn du das inhaltlich vertreten kannst - H_0 anders zu formulieren und zwar als eine theoretische Verteilung, die dir lieber ist. Dann teste einfach nochmal, und wenn K-S bzw. Chiquadrat nicht ablehnt, kannst du mit deiner „neuen“ H_0 (die davor ggf. zu H_1 gehört hat) weiterrechnen.

Ganz klar: So ein Vorgehen ist streng genommen keine saubere Statistik - geht in die Richtung von: erst testen, dann Signifikanzniveau festlegen. Aber wie gesagt, wenn du aus der Fragestellung heraus begründen kannst, warum eine von dir gewünschte Verteilung vertretbar wäre, dann halte ich persönlich es für akzeptabel. (Und ansonsten schadet es nichts zu sehen, mit welchen Tricks man arbeiten kann :wink:

Den Büning-Trenkler habe ich mir auf euer Anraten mal aus der
Bib bestellt. Werde ich schlau daraus, als Nicht-Mathematiker?

Aus den meisten Kapiteln schon, denke ich. Ansonsten kannst du ja hier nachfragen.

Viele Grüße
Katharina

Kolmogorow-Smirnov-Test beschäftigt. Mir ist dabei nicht klar
geworden, warum die erwartete Häufigkeit der i-ten Klasse mit
der beobachteten Häufigkeit der (i-1)-ten Klasse verglichen
wird. Aber vielleicht liegt es daran, dass (wie du vermutet
hast) meine theoretische Verteilung diskret ist.

Hm, die Teststatistik beim zweiseitigen K-S ist doch
sup|F_0(x) - F_n(x)| mit F_0 theoretische, F_n empirische
Verteilungsfunktion. Deswegen weiß ich jetzt nicht ,wie du
darauf kommst.

Hallo Katharina,

ich hatte mir diesen Wikipedia-Artikel angesehen:

http://www.wer-weiss-was.de/cgi-bin/forum/writeartic…

Dort heisst es über die beobachtete Häufigkeit S(xi) und die erwartete Häufigkeit Fo(xi):

Es wird für jedes i die absolute Differenz
di = | S(xi) − Fo(xi) | und auch
di = | S(xi − 1) − Fo(xi) |

berechnet. Es wird sodann die absolut größte Differenz dmax aus allen Differenzen ermittelt.

Ich warte mal, bis ich den Büning-Trenkler habe. Da wird es vielleicht klarer.

Noch mal vielen Dank!

Jan

Hallo Jan,

*anshirngreif* da stand ich auf dem Schlauch. Das hat tatsächlich mit der Diskretheit der empirischen Verteilungsfunktion zu tun; man betrachtet nämlich nur die Differenzen an den Sprungstellen, da sie dort maximal werden. Siehst du sofort, wenn du dir eine (stetige) theoretische Verteilungsfunktion gegen die empirische = kumulierte relative Häufigkeiten aufzeichnest.

Viele Grüße
Katharina

Es wird für jedes i die absolute Differenz
di = | S(xi) − Fo(xi) | und auch
di = | S(xi − 1) − Fo(xi) |

berechnet. Es wird sodann die absolut größte Differenz dmax
aus allen Differenzen ermittelt.

Meines Wissens liefert nur der Chiquadrat-Test
auch dann exakte kritische Bereiche, wenn die Verteilung nicht
vollständig spezifiziert ist, d.h. keine Parameter zu schätzen
sind.

Hier noch mal zum Ausgangspunkt meiner Fragstellung:
Wenn der Test auch bei einer nicht vollständig spezifizierten Verteilung funktioniert, kann ich dann Klassen, in denen die erwartete Häufigkeit zu gering ist, weglassen?

Voraussetzung zur Anwendung des Chi-Quadrat-Anpassungstests
ist, dass die erwartete Häufigkeit in jeder Klasse nie kleiner
als 1 und in weniger als 20% der Klassen kleiner 5 ist. Das
ist leider nicht der Fall.

Zwei Möglichkeiten:
a) Klassen, in denen die erwarte Häufigkeit zu gering ist
weglassen. Nachteil: Informationsverlust.
b) Klassen mit geringer erwarteter Häufigkeit zusammenfassen.
Nachteil: Ausgleichende Wirkung (wenn man z.B. zwei Klassen
zusammenfasst, von denen eine nach oben und eine nach unten
abweicht).