Interpretation von schiefe und kurtosis

hallo,
ich habe eine kurze Frage zur Schiefe und zum Exzess der Verteilung. ich habe einen homogenen Powertest (ohne Zeitbeschränkung) mit dichotomen Items (richtig/falsch), welche auf 3 Skalen laden. nun möchte ich mir die Punkteverteilung der 3 Skalen anschauen. der kolmogorov smirnov-test ist in allen 3 fällen bei einem Test auf Normalverteilung signifikant. Die schiefe beträgt jeweils -1.517, -.577 und -1.125. Das heißt, dass alle drei Verteilungen linkssteil sind. nun meine Frage: Was bedeutet das genau? ich habe wenig Probanden mit niedrigen Punktwerten und noch weniger Probanden mit sehr hohen Punktwerten? Ist der Test zu einfach? und muss eine Skala überhaupt immer normalverteilt sein? Was kann man tun, um die Verteilung zu verbessern?

Vielen Dank für eure Antworten im voraus!
Duplex

Da bin ich überfragt, tut mir Leid.

Hi duplex,

Was bedeutet das genau? ich habe wenig Probanden mit
niedrigen Punktwerten und noch weniger Probanden mit
sehr hohen Punktwerten?

schiefe zieht erstmal eine asymmetrie nach sich, d.h., die Verteilung ist nicht mehr symmetrisch zu seinem Erwartungswert ud dieser fällt höchstwahrscheinlich nicht mehr mit dem median zusammen. ansonsten ist die Interpretation wie bei jeder anderen Verteilung (z.b. log-normal).

und muss eine Skala überhaupt immer
normalverteilt sein?

Nö. Normalverteilung ist der heilige Gral, aber es geht heutzutage auch ohne.

Was kann man tun, um die Verteilung zu
verbessern?

Ist die Frage wozu? viele verwenden eine ANOVA weil der Betreuer schlicht nichts anderes kennt und wursteln dann ewig daran herum einen Ausweg aus der „nicht-noormalverteilungsfalle“ zu finden. dabei nutzen sie schlußendlich die Vorteile der ANOVA gar nicht und könnten mit anderen Verfahren realtiv einfach zu einem ergebnis kommen.
Die zentrale frage ist immer: Was willst du wissen?
wie groß ist das n, und was hast du für einflussgrößen?

Viee Grüße,
JPL

hallo,

vielen dank für die schnelle antwort. ich möchte einen test zur diagnostik einer störung entwickeln, den test habe ich jetzt an 88 probanden angewendet und eben diese werte bekommen. ich dachte mir, dass ein merkmal wie das sprachverständnis wahrscheinlich in der grundgesamtheit normalverteilt sein müsste, deswegen meinte ich, dass dies auch für meinen test zutreffen muss. mir scheint es so, als bekommen die meisten leute zuviele punkte und der test ist zu leicht. mir geht es dabei gar nicht um verfahren, sondern vielmehr darum, wie ich jetzt diese schiefe interpretiere. der k-s-test ist ja signifikant, aber ob das für mich jetzt praktische relevanz hat oder ob ich einfach schreibe, dass leider eine leichte abweichung von der nv existiert, welche aber unerheblich ist, weiß ich leider nicht. wenn du möchstet, kann ich auch mal ein histogramm hochladen.

vielen dank für deine hilfe

duplex

Hi Duplex,

mir geht es dabei gar nicht um verfahren, sondern
vielmehr darum, wie ich jetzt diese schiefe
interpretiere.

genauso, ie du es schon gemacht hast. dazu noch ein Histogramm und min,max,median,mean,Q1 und Q3 und dann ist es augenscheinlich, was vorliegt.

der
k-s-test ist ja signifikant, aber ob das für mich jetzt
praktische relevanz hat oder ob ich einfach schreibe, dass
leider eine leichte abweichung von der nv existiert, welche
aber unerheblich ist, weiß ich leider nicht.

Wenn du noch testen möchtest ist es relevant, wenn dir eine deskriptive genügt, nicht.

Viele Grüße,
JPL

wenn du möchstet,

kann ich auch mal ein histogramm hochladen.

vielen dank für deine hilfe

duplex

hier ist das histogramm: http://www.imagebanana.com/view/uv9hdafv/Clipboard01…
meiner meinung nach ist die abweichung für einen test in ordnung, die skala ist nicht nv, aber auf nicht so extrem, dass man grundlegende bedingungen ändern müsste. ich gebe also die deskriptiven maße an und sage, dass die verteilung linksschief ist und von der nv abweicht. aber wie interpretiere ich das nun in meinem test-kontext? der test ist ein wenig zu leicht, weil die meisten vps über dem arithmetischen mittel liegen? der test hat einen leichten deckeneffekt?

Hi,

meiner meinung nach ist die abweichung für einen test in
ordnung, die skala ist nicht nv, aber auf nicht so extrem,
dass man grundlegende bedingungen ändern müsste.

Um was zu bekommen? NV? wie gesagt muss man einen test nicht so designen, dass er NV ist.

ich gebe
also die deskriptiven maße an und sage, dass die verteilung
linksschief ist und von der nv abweicht.

Genau.

aber wie
interpretiere ich das nun in meinem test-kontext? der test ist
ein wenig zu leicht, weil die meisten vps über dem
arithmetischen mittel liegen? der test hat einen leichten
deckeneffekt?

Das kannst nur du als Fachmann beurteilen. wenn du Zeit / Muße / Lust hast kannst du auch einen schweren Test kreieren, um dann zu sehen, ob es „besser“ wird.
Aber nur am Test zu schrauben, damit man ein NV hat, ist wenig sinnvoll.

Viele Grüße,
JPL

Hallo,
wie du richtig interpretiert hast, bedeutet Linkssteile, dass eine Häufung der Fälle im unteren Wertebereich zu beobachten ist. Die Verteilung läuft also im oberen Bereich flacher aus als im unteren.
Ob du eine Normalverteilung bei deinen Skalen brauchst, hängt davon ab, was du später damit machen möchtest. Manche statistischen Verfahren beruhen auf der Normalverteilungsannahme, andere nicht. Es ist auch nach meiner Erfahrung von Fach zu Fach (manchmal auch von Lehrstuhl zu Lehrstuhl oder Firma zu Firma) unterschiedlich, wie ernst diese Bedingung genommen wird. Also am besten mal beim Prof/Betreuer/Chef nachfragen, wenn es den gibt :wink:
Ich kenne auch den Test nicht, den du genutzt hast, aber wenn der sagt, dass die Verteilung ausreichend normalverteilt ist (ich interpretiere deine Aussage „ist signifikant“ so), dann würde ich einfach zu weiterrrechnen. Eine Normalverteilung kann ja auch gestreckt, gestaucht usw. sein.
Vielleicht hilft das,
Grüße,
okka461

Hallo duplex__,

Die schiefe beträgt jeweils
-1.517, -.577 und -1.125. Das heißt, dass alle drei
Verteilungen linkssteil sind.

ich habe es genau umgekehrt in Erinnerung: Bei einer negativen Schiefe ist die Verteilung linksschief (bzw. rechtssteil). So steht es auch auf Wikipedia.

Was bedeutet das genau?
ich habe wenig Probanden mit niedrigen Punktwerten
und noch weniger Probanden mit sehr hohen Punktwerten?

Es bedeutet zunächst einmal nur, dass Deine Verteilung sich dadurch von der Normalverteilung unterscheidet, dass viele Werte eher etwas höher ausfallen.

Ist der Test zu einfach? und muss eine Skala überhaupt immer
normalverteilt sein?

Es gibt eine Reihe von Signifikanz-Tests, die Normalverteilung vorraussetzen (z.B. ANOVA). Die darfst Du nur nutzen, wenn Du annähernd normalverteilte Daten hast.

Was kann man tun, um die Verteilung zu verbessern?

Naja, die Verteilung ist halt so, wie sie ist. Die Frage ist, was Du tun kannst, um Deine Untersuchung trotz der linksschiefen Verteilung statistisch analysieren zu können.

Dazu ist es zunächst einmal wichtig herauszufinden, ob Deine Verteilungen wenigstens näherungsweise normalverteilt sind. Dies ist dann der Fall, wenn die Häufigkeitsverteilung prinzipiell aussicht wie eine Normalverteilung und sich nur der Knubbel für die häufigsten Werte nicht ganz in der Mitte befindet.

Näherungsweise normalverteilte Werte dürfen transformiert werden, bevor sie in die statistische Analyse aufgenommen werden. Beispielsweise könntest Du Deine linksschiefen Daten zunächst „umdrehen“, in dem Du sie mit -1 multiplizieren und anschließend die Vorzeichen löscht (mit abs). Nun kannst Du die Werte logarythmieren, wonach die Verteilung soweit normalverteilt aussehen sollte, dass sie in Signifikant-Tests und Regressionsanalysen aufgenommen werden kann.

Einen anderen Weg musst Du gegen, wenn Deine Daten nicht näherungsweise normalverteilt sind. Dies ist zum Beispiel dann der Fall, wenn der höchste Punkt der Häufigkeitsverteilung auf dem ersten oder dem letzten Wert ist. In einem solchen Fall würde man von einer Poisson-Verteilung der Daten sprechen. Zur statistischen Analyse sind dann Analysemodelle zu verwenden, die mit nicht normalverteilten Daten umgehen können (z.B. ein gemischt lineares Modell). Leider bietet SPSS hier nur ein sehr beschränktes Arsenal, sodass Du wahrscheinlich auf ein anderes Programm (z.B. GenStat, R) umsteigen müsstest.

Viele Grüße,
Kutya

Am besten du machst ein Histogramm oder Balkendiagramm. Schau, dass du möglichst viele Balken bekommst (da dur wenige Probanden hast, musst du ein wenig spielen). Bekomme dann ein gefühl für die Verteilung der Daten. K-S-Test und die beiden von dir berechneten Momente sind idR zu global undvermitteln kein gutes Bild der Verteilung, das sich inhaltlich interpretieren lässt.

@„Muss eine Verteilung normal verteilt sein“? In meinen Augen nicht. Es gibt aber gute Gründe dafür, zB die Intelligenztests der Eichstichprobe in eine N(100;15) zu überführen.

VG, Walter.

hallo duplex
wenn ich dich richtig verstanden habe, geht es um die verteilung von punktzahlen aus irgendeinem experiment. wenn die nicht normalverteilt sind, sind sie es halt nicht. da kannst du auch nicht deinen probanden sagen, sie sollen halt ein paar punkte mehr oder weniger machen. die verteilung darf man nicht verbessern.
die skala ist nicht normalverteilt, sondern wenn schon die beobachtungen. wenn die schiefe negativ ist, dann ist deine verteilung linksschief (d.h. rechtssteil!).
schau mal da: http://de.wikipedia.org/wiki/Schiefe_%28Statistik%29
viele grüsse!

Sorry, aber da bin ich überfragt… Gruß

Wichtig für statistische Analyse ist hier ertmal der Normalverteilungs Test. Wenn alle Verteilungen NV sind, spielt die Kurtosis bzw. Schiefe eigentlich keine Rolle, soondern ist rein informativ. Nur wie können die Daten (richtig/falsch) normalverteilt sein, da rein attributiv?! Bei großen n nähert sich die Binomialverteilung zwar der Normalverteilung, ist aber nicht das richtige Modell…
Eine Verteilung kann man nicht „verbessern“, man kann nur die Stichprobe erhöhen um ggf. eine passenderes Modell zu erhalten.

Gruß, Michael

____________________________________________