ich schreibe gerade an meiner diplomarbeit und habe in einer kreuztabelle zwei variablen gegenüber gestellt, die eine ordinal die andere nominal. die kreutabelle ist asymetrisch.
zunächst ergab der chi² test einen wert von 33,742 mit einer asymptotischen signifikanz von ,000. heißt also, es besteht ein signifikanter zusammenhang zwischen den beiden variablen. allerdings gibt spss auch an: 8 Zellen (66,7%) haben eine erwartete Häufigkeit kleiner 5
das bedeutet für mich ja, mein chi²test ist statistisch angreifbar.
ist er damit dann nicht signifikant??
und weiter:
ich habe dann cramer-v mit einem wert von ,184 und einer näherungsweisen signifikanz von ,000 berechnet. dass bedeutet also, es besteht zu 100% eine geringer zusammenhang.
wie kann ich das aber denn jetzt abschließend darstellen?? es verwirrt mich, dass ein zusammenhang besteht, der zwar gering ist, aber ich aufgrund des zellenwertes 66,7% keine signifikanz darstellen kann!
was schreibt man denn als abschlusssatz unter diese untersuchung??
zunächst ergab der chi² test
allerdings gibt spss auch an: 8 Zellen (66,7%) haben eine
erwartete Häufigkeit kleiner 5 das bedeutet für mich ja, mein
chi²test ist statistisch angreifbar.
ist er damit dann nicht signifikant??
nein. Es bedeutet, daß der Chi-Quadrat-Test nicht verwendbar ist, weil eine seiner wesentlichen Voraussetzungen verletzt ist. Das Ergebnis, das man mit der theoretischen Chi-Quadrat-Verteilung erhält, ist nicht belastbar.
ich habe dann cramer-v mit einem wert von ,184 und einer
näherungsweisen signifikanz von ,000 berechnet. dass bedeutet
also, es besteht zu 100% eine geringer zusammenhang.
Nein. Auch das Signifikanzniveau von Cramers V ist nicht belastbar, da - wie gesagt - eine wesentliche Voraussetzung für den Signifikanztest nicht erfüllt ist und auch der Signifikanztest für Cramers V auf der Chi-Quadrat-Statistik beruht.
wie kann ich das aber denn jetzt abschließend darstellen??
Du kannst das Signifikanzniveau anhand einer Monte-Carlo-Simulation abschätzen. SPSS bietet diese Option im Menü „Kreuztabellen“ im Untermenü „Exakt“ an. Das Verfahren wird auch als Craddock-Floods-Chi-Quadrat-Test in Bortz, Lienert & Boehnke beschrieben.
vielen lieben dank für deine schnelle antwort.
also, das bedeutet ich kann alle meine berechnungen (bei den meisten ist der zellenwert bei 33,3%) in den müll schmeissen. mist!jetzt wird es knapp mit der abgabe
zu deinem vorschlag:
spss gibt mir bei der monte-carlo-simulation nur die kreuztabelle aus. irgendwie funktioniert das nicht! woran kann das liegen??
gruß
so, laut spss geht diese berechnung wohl auch über:
analysieren-nichtparametrische test-beliebiger test
dort habe ich dann unverdrossen wieder chi² angeklickt und mit der ausgabe kam dann auch die monte-carlo-simulation raus.
werte:
chi² für V1: 399,952 V2:1307,225
asympotitsche s: je ,000
monte-carlo signifikanz je ,00
99%-konfidenzintervall
untergrenze je,000
obergrenze je ,000
dann:
a Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 166,7.
b Bei 0 Zellen (,0%) werden weniger als 5 Häufigkeiten erwartet. Die kleinste erwartete Zellenhäufigkeit ist 124,3.
c Basiert auf 10000 Stichprobentabellen mit einem Startwert von 2000000.
warum sagt der chi² hier bei 0% werden wenige als 5 häufigkeiten erwartet, bei der normalen berechnung aber 66,7%???
kann ich die werte oben so benutzen, heißt zeigt die monte-carlo-simulation jetzt eine signifikanz??
gruß
nehmen wir an die variable 1 (v1) ist unterteilt in a „hat kein problem mit…“ b „hat etwas probleme mit…“ c „ist pathologisch“
die kann in spss glaube ich nicht unterteilen. ich könnte höchstens eine von denen weglassen. z.b. die a
aber ich bin einfach auch zu schwach in statistik, um das alles erkennen zu können.
also im von mir gemeinten fall geht es um den familienstand (v2)
mir ist schon irgendwo klar, dass die klassen einfach zu schlecht besetzt sind, aber was soll ich machen??
gleiches gilt auch für die untersuchungen der v1 mit einer ordinalen häufigkeits-variablen wie täglich, mehrmals/woche, mehrmals/monat, mehrmals/jahr, wobei da wenigsten noch 33,3% rauskommt, was man zur not (und die habe ich) glaube ich noch verwerten kann!!
warum sagt der chi² hier bei 0% werden wenige als 5
häufigkeiten erwartet, bei der normalen berechnung aber
66,7%???
weil es sich um zwei verschiedene Arten von Chi-Quadrat-Tests handelt. Der eine bezieht sich auf die Frage, ob ZWEI Variablen stochastisch unabhängig sind, der andere darauf, die die beiden Variablen JE FUER SICH GESEHEN eine bestimmte Verteilung aufweisen.
Warum die Monte-Carlo-Option bei Deiner Kreuztabelle nicht „geht“, kann ich Dir von hier aus nicht sagen. Du könntest mir allerdings die Daten rüberschicken und ich könnte es nachprüfen. Meine Mailadresse steht über dem Postingtext.
nehmen wir an die variable 1 (v1) ist unterteilt in a „hat
kein problem mit…“ b „hat etwas probleme mit…“ c „ist
pathologisch“
die kann in spss glaube ich nicht unterteilen.
rein technisch gesehen geht es schon. Aber das ist nicht entscheidend. Du müßtest eine inhaltliche Begründung geben, warum Du bestimmte Kategorien zusammenfaßt. Sonst riecht es schwer nach Datenmanipulation, um den Chi-Quadrat-Test anwenden zu können. Zumindest wenn ich Dein Gutachter wäre, würde ich nachhaken.
Ok, jetzt ist das etwas klarer. Um auch auf Olivers Anmerkung einzugehen, ich würde nur die ordinale Variable zusammenfassen (aus pragmatischer Sicht, eben um Chi-Quadrat-Tests anwenden zu können).
Aber man sieht auch, dass es nicht viel bringen würde. In Frage kämen b+c als gemeisame Kategorie (sozusagen als Störung vorhanden), dann hätte man
6 15
90 383
0 1
0 2
Man könnte den Vergleich nur auf verheiratet und ledig beschränken und hätte
6 15
90 383
Die anderen beiden Kategorien (geschieden und verwittwet)würde ich ohnehin vernachlässigen - die sind viel zu ungleich besetzt zu den anderen.
Rein deskriptiv ergibt sich an Zeilenprozenten
28,6%(a) zu 71,4%(b&c) bei den verheirateten
19,0%(a) zu 81,0%(b&c) bei den ledigen
Wenn es keinen Unterschied in der Beobachtung gäbe (H0 trifft zu), dann wären diese Tellen wie folgt besetzt:
4 17
92 381,
was angesichts der Besetzungszahlen in der ersten Zeile kein großer Unterschied zur gefundenen Matrix ist.
Die ca. 10% Gefälle ergeben sich dem zufolge auch nicht als signifikanter Unterschied mit X²(1)= 1,17; p= 0,28.
Das könnte man so machen - ob es sinnvoll ist, ist wie gesagt eine andere Geschichte.