Kontingenzkoeffizient bei unterschiedlichen Skalen

Hallo,

ich habe eine Frage zur statistischen Berechnung des Kontingenzkoeffizienten.

Ich habe folgendes Beispiel.
Zwei Nutzergruppen: Männer und Frauen
Diese Nutzergruppen beantworten einen Fragebogen, der aus vielen unterschiedlich skalierten Fragen besteht.

Frage 1: Essen Sie gerne Obst? Antwortmöglichkeiten auf einer Likert- Skala von 1= trifft gar nicht zu - 7= trifft vollkommen zu
Frage 2: Haben Sie Übergewicht? Antwortmöglichkeiten zum auswählen (nur eine Antwort möglich): Ja, deutlich - Ja, etwas, Nein, ich weiß nicht
Frage 3: Welche Speisen mögen Sie gerne? (mehrere Antworten möglich): Gemüse, Obst, Fleisch, Fisch
Frage 4: Wie schwer sind Sie? Eingabe erfolgt in kg manuell.

Nun möchte ich Aussagen treffen, welche als Laie schon beim beobachten der Daten offensichtlich sind. Beispielsweise mögen Männer gerne Fleisch, Frauen hingegen bevorzugen Obst. Ich möchte also den Kontingenzkoeffizienten zischen der Nutzergruppe und den Antworten berechnen, um einen Zusammenhang erkennen zu können.
Welche mathematische Verfahren kann ich dort anwenden? Ich bin mir nicht sicher, ob ich an dieser Stelle Cramers V oder ob ich den Kontingenzkoeffizienten nach Karl Pearson berechnen kann. Meine Zweifel sind in den unterschiedlichen Skalen begründet.
Über eine kleine Hilfestellung wäre ich sehr dankbar!

Viele Grüße

Hi

mit nominal skalierten Merkmalen ist die Berechnung des Kontingenzkoeffizienten nicht so einfach möglich.
Vor allem da in einer Frage Mehrfachnennungen möglich sind.

Ich würde vielleicht versuchen einen Zusammenhang (also eine von dir aufgestellte Hypothese) zu beweisen, wie eben zum Beispiel
„Männer essen eher Fleisch“.
Das wird gehen :smile:

mfg
Talianna

hi,

Ich habe folgendes Beispiel.
Zwei Nutzergruppen: Männer und Frauen
Diese Nutzergruppen beantworten einen Fragebogen, der aus
vielen unterschiedlich skalierten Fragen besteht.

Frage 1: Essen Sie gerne Obst? Antwortmöglichkeiten auf einer
Likert- Skala von 1= trifft gar nicht zu - 7= trifft
vollkommen zu

ordinal

Frage 2: Haben Sie Übergewicht? Antwortmöglichkeiten zum
auswählen (nur eine Antwort möglich): Ja, deutlich - Ja,
etwas, Nein, ich weiß nicht

bedingt ordinal, eigentlich nominal. (wo steht „ich weiß nicht“ in der ordnung?)

Frage 3: Welche Speisen mögen Sie gerne? (mehrere Antworten
möglich): Gemüse, Obst, Fleisch, Fisch

nominal

Frage 4: Wie schwer sind Sie? Eingabe erfolgt in kg manuell.

metrisch bzw. intervallskaliert

Nun möchte ich Aussagen treffen, welche als Laie schon beim
beobachten der Daten offensichtlich sind. Beispielsweise mögen
Männer gerne Fleisch, Frauen hingegen bevorzugen Obst. Ich
möchte also den Kontingenzkoeffizienten zischen der
Nutzergruppe und den Antworten berechnen, um einen
Zusammenhang erkennen zu können.
Welche mathematische Verfahren kann ich dort anwenden? Ich bin
mir nicht sicher, ob ich an dieser Stelle Cramers V oder ob
ich den Kontingenzkoeffizienten nach Karl Pearson berechnen
kann. Meine Zweifel sind in den unterschiedlichen Skalen
begründet.

nein, geht nicht. deine zweifel haben recht.

Über eine kleine Hilfestellung wäre ich sehr dankbar!

mehr als chi-quadrat-tests (vierfeldertafel etc.) sind nicht drin. dazu musst du noch die antworten auf die 4. frage gruppieren.

übrigens: wie repräsentativ ist denn deine stichprobe?

m.

mehr als chi-quadrat-tests (vierfeldertafel etc.) sind nicht
drin. dazu musst du noch die antworten auf die 4. frage
gruppieren.

vielen dank! chi quadrat habe ich für cramers v schon berechnet und muss es nur auswerten. aber die größe von chi quadrat sagt nichts über die stärke des zusammenhanges aus? ich kann lediglich sagen, ob die hypothese (variablen sind unabhängig) stimmt oder verworfen wird, richtig? ein größerer chi quadrat wert bedeutet nicht, dass der zusammenhang größer ist?

übrigens: wie repräsentativ ist denn deine stichprobe?

glücklicherweise beinhaltet meine stichprobe alle bisher existierenden fälle und ist somit nicht nur ein teil des ganzen.

hi,

vielen dank! chi quadrat habe ich für cramers v schon
berechnet und muss es nur auswerten. aber die größe von chi
quadrat sagt nichts über die stärke des zusammenhanges aus?
ich kann lediglich sagen, ob die hypothese (variablen sind
unabhängig) stimmt oder verworfen wird, richtig? ein größerer
chi quadrat wert bedeutet nicht, dass der zusammenhang größer
ist?

nnajja. im prinzip geht es um das überschreiten eines schwellenwerts, das dann abhängigkeit der variablen nahelegt. je nachdem, zu welchem niveau du das durchführst, kannst du abhängigkeit mit größerer sicherheit nahelegen.
das hat alles schon mit konzingenz (zusammenhang) zu tun; man nennt vierfeldertafeln nicht umsonst auch „kontingenztefeln“.

übrigens: wie repräsentativ ist denn deine stichprobe?

glücklicherweise beinhaltet meine stichprobe alle bisher
existierenden fälle und ist somit nicht nur ein teil des
ganzen.

du glücklicher. eine vollerhebung!

m.

Hallo,

nnajja. im prinzip geht es um das überschreiten eines
schwellenwerts, das dann abhängigkeit der variablen nahelegt.
je nachdem, zu welchem niveau du das durchführst, kannst du
abhängigkeit mit größerer sicherheit nahelegen.
das hat alles schon mit konzingenz (zusammenhang) zu tun; man
nennt vierfeldertafeln nicht umsonst auch „kontingenztefeln“.

vielen Dank für deine Antwort Michael!
Mein Problem ist, dass bei gewissen Fragen eine Antwort Pflicht ist, andere Fragen freiwillig sind. Somit ist der Umfang der Teilnehmer bei vielen Antworten sehr unterschiedlich. Daher gibt es sehr große, aber auch kleine Chi Quadrat. Kann man zumindest Chi Quadrat Werte vergleichen, wo deren Teilnehmerumfang gleich ist? Angenommen ich habe zwei Chi Quadrat Werte, welche den Schwellenwert überschreiten. Ein Chi Quadrat Wert ist jedoch 5 mal größer als der andere Chi Quadrat Wert. Kann man daraus folgern, dass der größere Wert auf einen stärkeren Zusammenhang der untersuchten Variablen deutet?

Viele Grüße