Voraussetzung zur Varianzanalyse // Normalverteilung

Hallo liebes Forum und liebe Experten,

ich muss noch einmal eine Frage zur Varianzanalyse und genauer gesagt zur Prüfung der Normalverteilungsprämisse stellen.

Folgende Gegebenheiten: Meine Stichprobe umfasst insgesamt rund 360 Versuchspersonen (VPN). Nun will ich eine Varianzanalyse berechnen und habe hierfür insgesamt 4 feste Faktoren mit je 3-4 Faktorstufen.

Varianzhomogenität wird bislang immer durch den Levene-Test bestätigt. Bei der Normalverteilung tue ich mich allerdings sehr schwer. Das liegt daran, dass ich inzwischen nicht einmal mehr sicher bin, was überhaupt geprüft werden muss, weil ich ständig etwas anderes hierzu finde:

(a) Normalverteilung der Residuen insgesamt
(b) Normalverteilung der Residuen innerhalb der Gruppen (festen Faktoren)
© Normalverteilung der aV insgesamt
(d) Normalverteilung der aV innerhalb der Gruppen (festen Faktoren)

Wenn ich nun einmal annehme, dass die Verteilung der Residuen insgesamt gemeint ist, gehe ich dann richtig vor, wenn ich in einem ersten Schritt (in SPSS) die mehrfaktorielle ANOVA rechne und dann bei speichern die Residuen als Variable abspeichere, um dann in einem zweiten Schritt über das Menü „Analysieren -> deskriptive Statistik -> explorative Datenanalyse“ die Variable „Residuen“ auf Normalverteilung teste?

Dort sind dann aber sowohl Kolmogorow-Smirnow als auch Shapiro-Wilk signifikant, was scheinbar nicht allzu überraschend sein soll. Kann ich dann dennoch mittels grafischer Betrachtung (Q-Q plot, Histrogramm etc.) wenigstens auf eine annähernde NV prüfen?

Oder ist das sowieso alles Quatsch und die Anova kann auch ohne Prüfung der NV gerechnet werden?

Vielleicht kann mir hier jemand weiterhelfen.

Viele liebe Grüße
MP

Hi MerlinPerlin,

(a) Normalverteilung der Residuen insgesamt
(b) Normalverteilung der Residuen innerhalb der Gruppen
(festen Faktoren)
© Normalverteilung der aV insgesamt
(d) Normalverteilung der aV innerhalb der Gruppen (festen
Faktoren)

du solltest die Residuen testen und zwar in den Gruppen, da dies die Voraussetzungen sind (wobei es auch diverse Meinungen gibt, wie relevant diese ist).
Allerdings bringt das andere Probleme mit sich: Multiplizität und dass der Test ‚verkehrt‘ herum angewendet wird komplettiert die generelle Frage, ob man Voraussetzungen überhaupt testen kann bzw sollte.
Von daher gibt es verschiedenste Ansätze. Sicherlich sinnvoll ist es einen QQ Plot über alle Residuen zu machen um einen Eindruck zu bekommen, ob da was nicht in Ordnung sein könnte. Allerdings bedarf eine solchen Einschätzung etwas Übung und es ist hilfreich, wenn du dir ein paar Daten verschiedener Verteilungen simulierst und dir dann mal einen QQPLot dazu anschaust.
Falls du dann mit deinen Daten etwas findest kann ein QQPlot über die Gruppen weiterhelfen um herauszufinden ob es an einer bestimmten liegt oder an etwas anderem.

Insgesamt ist es eher ein explorativer Ansatz als ein konfirmatorischer was daran liegt dass du auch nicht _beweisen_ kannst dass eine Normalverteilung vorliegt sondern nur hinreichend sicher belegen kannst, dass die Annahme nicht völlig dahergeholt ist.

Viele Grüße,
JPL

Hallo JPL,

allem was ich im Internet gelesen habe nach zu urteilen, scheint es als Prämisse für meine Varianzanalyse „in Ordnung“ zu sein, wenn ich also eine Stichprobe von ca. 300 Personen in mein Modell aufnehme kann und zudem Varianzhomogenität gegeben ist.

Mein QQ-Plot sieht allerdings folgendermaßen aus. Wie würdest du das einschätzen?

http://s14.directupload.net/images/141015/u3hsm2lk.png

Viele Grüße
MP