Statistik,SPSS, chi²

sculte · 29. Dezember 2007 um 17:20

hallo ihr lieben,

ich schreibe gerade an meiner diplomarbeit und habe in einer kreuztabelle zwei variablen gegenüber gestellt, die eine ordinal die andere nominal. die kreutabelle ist asymetrisch.

zunächst ergab der chi² test einen wert von 33,742 mit einer asymptotischen signifikanz von ,000. heißt also, es besteht ein signifikanter zusammenhang zwischen den beiden variablen. allerdings gibt spss auch an: 8 Zellen (66,7%) haben eine erwartete Häufigkeit kleiner 5
das bedeutet für mich ja, mein chi²test ist statistisch angreifbar.
ist er damit dann nicht signifikant??

und weiter:
ich habe dann cramer-v mit einem wert von ,184 und einer näherungsweisen signifikanz von ,000 berechnet. dass bedeutet also, es besteht zu 100% eine geringer zusammenhang.

wie kann ich das aber denn jetzt abschließend darstellen?? es verwirrt mich, dass ein zusammenhang besteht, der zwar gering ist, aber ich aufgrund des zellenwertes 66,7% keine signifikanz darstellen kann!

was schreibt man denn als abschlusssatz unter diese untersuchung??

lieben gruß
jörg

aiwendil · 29. Dezember 2007 um 18:16

Hallo,

zunächst ergab der chi² test
allerdings gibt spss auch an: 8 Zellen (66,7%) haben eine
erwartete Häufigkeit kleiner 5 das bedeutet für mich ja, mein
chi²test ist statistisch angreifbar.
ist er damit dann nicht signifikant??

nein. Es bedeutet, daß der Chi-Quadrat-Test nicht verwendbar ist, weil eine seiner wesentlichen Voraussetzungen verletzt ist. Das Ergebnis, das man mit der theoretischen Chi-Quadrat-Verteilung erhält, ist nicht belastbar.

ich habe dann cramer-v mit einem wert von ,184 und einer
näherungsweisen signifikanz von ,000 berechnet. dass bedeutet
also, es besteht zu 100% eine geringer zusammenhang.

Nein. Auch das Signifikanzniveau von Cramers V ist nicht belastbar, da - wie gesagt - eine wesentliche Voraussetzung für den Signifikanztest nicht erfüllt ist und auch der Signifikanztest für Cramers V auf der Chi-Quadrat-Statistik beruht.

wie kann ich das aber denn jetzt abschließend darstellen??

Du kannst das Signifikanzniveau anhand einer Monte-Carlo-Simulation abschätzen. SPSS bietet diese Option im Menü „Kreuztabellen“ im Untermenü „Exakt“ an. Das Verfahren wird auch als Craddock-Floods-Chi-Quadrat-Test in Bortz, Lienert & Boehnke beschrieben.

Beste Grüße

sculte · 29. Dezember 2007 um 19:05

vielen lieben dank für deine schnelle antwort.
also, das bedeutet ich kann alle meine berechnungen (bei den meisten ist der zellenwert bei 33,3%) in den müll schmeissen. mist!jetzt wird es knapp mit der abgabe
zu deinem vorschlag:
spss gibt mir bei der monte-carlo-simulation nur die kreuztabelle aus. irgendwie funktioniert das nicht! woran kann das liegen??
gruß

sculte · 29. Dezember 2007 um 19:19

so, laut spss geht diese berechnung wohl auch über:
analysieren-nichtparametrische test-beliebiger test
dort habe ich dann unverdrossen wieder chi² angeklickt und mit der ausgabe kam dann auch die monte-carlo-simulation raus.
werte:

chi² für V1: 399,952 V2:1307,225

asympotitsche s: je ,000
monte-carlo signifikanz je ,00
99%-konfidenzintervall
untergrenze je,000
obergrenze je ,000

dann:

a Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 166,7.
b Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 124,3.
c Basiert auf 10000 Stichprobentabellen mit einem Startwert von 2000000.

warum sagt der chi² hier bei 0% werden wenige als 5 häufigkeiten erwartet, bei der normalen berechnung aber 66,7%???

kann ich die werte oben so benutzen, heißt zeigt die monte-carlo-simulation jetzt eine signifikanz??
gruß

der „verzweifelte“
jörg

patr1ck · 29. Dezember 2007 um 19:36

Hallo Jörg,

kannst Du denn nicht die ordinale Variable geeignet gruppieren, dass die Zellhäufigkeiten sich im Chi-Quadrat-Test erfüllen?

Also z.B. mittels Split-Half am Median trennend auf zwei Klassen reduzieren?

Vielleicht klappt es dann mit dem Chi-Quadrat-Test?

Oder magst Du mal die Werte postulieren?

Lieben Gruß
Patrick

sculte · 29. Dezember 2007 um 20:16

hallo patrick,

nehmen wir an die variable 1 (v1) ist unterteilt in a „hat kein problem mit…“ b „hat etwas probleme mit…“ c „ist pathologisch“

die kann in spss glaube ich nicht unterteilen. ich könnte höchstens eine von denen weglassen. z.b. die a
aber ich bin einfach auch zu schwach in statistik, um das alles erkennen zu können.

also im von mir gemeinten fall geht es um den familienstand (v2)

verheiratet a6 b15 c-
ledig a90 b355 c28
geschieden a- b1 c-
verwitwet a0 b0 c2

mir ist schon irgendwo klar, dass die klassen einfach zu schlecht besetzt sind, aber was soll ich machen??

gleiches gilt auch für die untersuchungen der v1 mit einer ordinalen häufigkeits-variablen wie täglich, mehrmals/woche, mehrmals/monat, mehrmals/jahr, wobei da wenigsten noch 33,3% rauskommt, was man zur not (und die habe ich) glaube ich noch verwerten kann!!

aiwendil · 29. Dezember 2007 um 21:26

Hallo Jörg,

warum sagt der chi² hier bei 0% werden wenige als 5
häufigkeiten erwartet, bei der normalen berechnung aber
66,7%???

weil es sich um zwei verschiedene Arten von Chi-Quadrat-Tests handelt. Der eine bezieht sich auf die Frage, ob ZWEI Variablen stochastisch unabhängig sind, der andere darauf, die die beiden Variablen JE FUER SICH GESEHEN eine bestimmte Verteilung aufweisen.

Warum die Monte-Carlo-Option bei Deiner Kreuztabelle nicht „geht“, kann ich Dir von hier aus nicht sagen. Du könntest mir allerdings die Daten rüberschicken und ich könnte es nachprüfen. Meine Mailadresse steht über dem Postingtext.

Beste Grüße

aiwendil · 29. Dezember 2007 um 21:30

Hallo,

nehmen wir an die variable 1 (v1) ist unterteilt in a „hat
kein problem mit…“ b „hat etwas probleme mit…“ c „ist
pathologisch“
die kann in spss glaube ich nicht unterteilen.

rein technisch gesehen geht es schon. Aber das ist nicht entscheidend. Du müßtest eine inhaltliche Begründung geben, warum Du bestimmte Kategorien zusammenfaßt. Sonst riecht es schwer nach Datenmanipulation, um den Chi-Quadrat-Test anwenden zu können. Zumindest wenn ich Dein Gutachter wäre, würde ich nachhaken.

Grüße

patr1ck · 30. Dezember 2007 um 01:13

Hallo!

verheiratet a6 b15 c-
ledig a90 b355 c28
geschieden a- b1 c-
verwitwet a0 b0 c2

Ok, jetzt ist das etwas klarer. Um auch auf Olivers Anmerkung einzugehen, ich würde nur die ordinale Variable zusammenfassen (aus pragmatischer Sicht, eben um Chi-Quadrat-Tests anwenden zu können).

Aber man sieht auch, dass es nicht viel bringen würde. In Frage kämen b+c als gemeisame Kategorie (sozusagen als Störung vorhanden), dann hätte man

6 15
90 383
0 1
0 2

Man könnte den Vergleich nur auf verheiratet und ledig beschränken und hätte

6 15
90 383

Die anderen beiden Kategorien (geschieden und verwittwet)würde ich ohnehin vernachlässigen - die sind viel zu ungleich besetzt zu den anderen.

Rein deskriptiv ergibt sich an Zeilenprozenten

28,6%(a) zu 71,4%(b&c) bei den verheirateten
19,0%(a) zu 81,0%(b&c) bei den ledigen

Wenn es keinen Unterschied in der Beobachtung gäbe (H0 trifft zu), dann wären diese Tellen wie folgt besetzt:

4 17
92 381,

was angesichts der Besetzungszahlen in der ersten Zeile kein großer Unterschied zur gefundenen Matrix ist.

Die ca. 10% Gefälle ergeben sich dem zufolge auch nicht als signifikanter Unterschied mit X²(1)= 1,17; p= 0,28.

Das könnte man so machen - ob es sinnvoll ist, ist wie gesagt eine andere Geschichte.

Lieben Gruß
Patrick

sculte · 30. Dezember 2007 um 17:34

hallo,

vielen vielen dank für eure hilfe, hat mich sehr weitergebracht!

gruß

jörg