Regressionsanalyse & Mehrfachantworten

Hallo zusammen,

ich versuche zur Zeit eine Regressionsanalyse in SPSS durchzuführen und soll dabei kategoriale Variablen als Kontrollvariablen miteinbeziehen. Diese kategorialen Variablen habe ich entweder Dummy- oder Effekt-kodiert.Allerdings ist die Möglichkeit für Mehrfachantworten innerhalb einer kategorialen Variable gegeben und von den Befragten auch genutzt worden.

Z.B. wurde nach dem Familienstand gefragt. Einige Probanden haben beispielsweise „geschieden“ und gleichzeitig „wieder verheiratet“ angekreuzt.

Wie setze ich solche Mehrfachantworten in die Dummy- bzw. Effekt-Kodierung um? Muss ich zusätzliche Kodiervariablen einführen und zwar jeweils eine neue Kodiervariable pro möglicher Antwortkombination? Oder gibt es leichtere Lösungsmöglichkeiten?
Wäre toll, wenn mir hierbei jemand weiterhelfen könnte. …

Hallo Kayce,

in einem solchen Fall tendiere ich dazu, die kategoriellen Variablen so zu erweitern, dass jede Merkmalskombination eine eigene Kategorie erhält. Den Kategorien a und b wird also die kombinierte Kategorie ab hinzugefügt.

Viele Grüße,
kutya

was meinste mit „Effekt-kodiert“?

Hi,

ich wüsste nur die Möglichkeit über eine zusätzliche Kodiervariable.
Grüße,
JPL

Hallo,

das Problem mit dem Beispiel, das du beschreibst, ist natürlich, dass die Ausprägungen sich gegenseitig bedingen. Wenn man nicht geschieden ist, kann man auch nicht wiederverheiratet sein. Du könntest natürlich Dummys setzen für „geschieden, aber nicht wiederverheiratet“ und „geschieden und wiederverheiratet“. Dann hättest du das Problem halbwegs elegant umschifft. Wenn du die Variable kodierst, achte bitte darauf, dass es sich dabei um ordinalskalierte Variablen handelt. Dann wird es mit der Regressionsanalyse schwierig. Ich persönlich finde Dummies schon ziemlich grenzwertig, aber das hat sich nunmal durchgesetzt. Muss es denn unbedingt eine Regressionsanalyse sein? Kann man deine Fragestellung nicht auch anders beantworten, so dass das Problem gar nicht auftritt?

Gruß, Andreas

Hallo!
ich glaube, ich habs noch nicht ganz verstanden- durften die Leute so ankreuzen oder nicht? Machen alle Kombinationen inhaltlich Sinn? Dann würde ich für jede benutzte sinnvolle Kombi eine weitere Stufe in der Variablen machen, dann gibts eben nicht nur ledig-verheiratet-geschieden, sondern auch die Kombinationen. einfache Lösung falls sies nicht durften: rauswerfen.
fragwürdige Lösung: überlegen, was bei der Kombi pro Vpn der letzte Stand ist und entsprechend kodieren…

Viele Grüße

Hallo kutya,

vielen Dank für die schnelle Antwort.
Ich werde es ausprobieren, einfach neue Variablen für sinnvolle Merkmalskombinationen einzuführen.

Ich habe noch ein weiteres Problem im gleichen Zusammenhang. Vielleicht kannst Du mir hier auch einen Tipp geben (wenn nicht, auch nicht schlimm, immerhin bin ich so ja schon ein Stück weiter :smile:): Wenn bei einer kategorialen Variablen neben den anderen Kategorien als zusätzliche Antwortmöglichkeit „Sonstiges“ ankreuzbar war, ist es dann sinnvoll diese „Sonstige“-Gruppe auch mit einer Kodiervariablen im Rahmen der Regressionsanalyse zu berücksichtigen? Oder macht es mehr Sinn diese Fälle außen vor zu lassen, nachdem „Sonstiges“ keine Gemeinsamkeit darstellt und es daher nur zu verfälschenden Ergebnissen führt, wenn man diese Fälle in einen Topf werfen würde?

Danke nochmal für die erste Hilfe und viele Grüße,
Kayce

Hallo JPL,
danke, so werde ich es probieren.

Viele Grüße,
Kayce

Hallo Andreas,

vielen Dank für die hilfreichen Tipps.
Leider muss das Problem mit einer Regressionsanalyse gelöst werden - das war die Vorgabe.Die Interpretation der Regressionsgleichung mit Dummies finde ich zwar auch nicht so einfach, vor allem wenn die kategorialen Variablen als Moderatoren für einen anderen Haupteffekt untersucht werden sollen…Nun ja, ich werde es versuchen.

Ich habe noch ein weiteres Problem im gleichen Zusammenhang. Vielleicht kannst Du mir hier auch einen Tipp geben (wenn nicht, auch nicht schlimm, immerhin bin ich so ja schon ein Stück weiter :smile:): Wenn bei einer kategorialen Variablen neben den anderen Kategorien als zusätzliche Antwortmöglichkeit „Sonstiges“ ankreuzbar war, ist es dann sinnvoll diese „Sonstige“-Gruppe auch mit einer Kodiervariablen im Rahmen der Regressionsanalyse zu berücksichtigen? Oder macht es mehr Sinn diese Fälle außen vor zu lassen, nachdem „Sonstiges“ keine Gemeinsamkeit darstellt und es daher nur zu verfälschenden Ergebnissen führt, wenn man diese Fälle in einen Topf werfen würde?

Danke nochmal für die erste Hilfe und viele Grüße,
Kayce

Hallo Gozadank,

ja, die Leute durften mehrfach ankreuzen. Ich denke, ich werde versuchen, die sinnvollen Kombinationen als zusätzliche Kodiervariable einzuführen.

Vielen Dank für die schnelle Antwort und den Tipp.
Ein schönes Wochenende,
Kayce

Sorry, aber da kann ich leider nicht weiter helfen…

Gruß Robert

Trotzdem Danke!

Gruß,
Kayce

Sorry, aber da kann ich leider nicht weiter helfen…

Gruß Robert

hallo kayce
zuerst musst du deine daten in ordnung kriegen. wenn jemand „wieder verheiratet“ angekreuzt hat, muss er/sie ja vorher verheiratet und geschieden worden sein. ohne saubere daten geht alles in die hose.

kategorielle variablen als unabhängige variablen in eine regression zu packen führt in aller regel zu unbrauchbaren resultaten. stattdessen musst du einzelne dummy-variablen daraus machen. das heisst z.b. bei drei antwortmöglichkeiten zwei dummys erstellen.

viel erfolg! rolf

Hallo Rolf,

vielen Dank für die Antwort. Die Dummies habe ich eingeführt und werde jetzt sehen, ob ich signifikante Zusammenhänge finde.

Viele Grüße,
Kayce

Also ich würde die „Sonstigen“ auf jeden Fall mit aufnehmen, weil dies auch zeigen kann, ob deine anderen Antwortmöglichkeiten sinnvoll gewählt sind. Wenn nur die Sonstigen signifikant sind, der Rest aber nicht, dann war schon die Frage falsch gestellt.

Gruß, Andreas

Hallo Kayce,

der Umgang mit „Sonstigen“ ist tatsächlich gar nicht so einfach. Im Normalfall sollten hier ja wenige sehr unterschiedliche Merkmale zusammengefasst sein. Der Beitrag der Sonstigen zur Regressionsgleichung müsste also klein ausfallen. Doch manchmal verbirgt sich hinter den Sonstigen ein bisher noch nicht beachtetes Merkmal, dass sehr wohl einen eigenen Einfluss besitzt.

Darum gehe ich wie folgt vor: In einer ersten, erkundenden Analyse lasse ist die Sonstigen als eigene Kategorie einfließen. Ist Ihre Bedeutung für die Regression vernachlässigbar, dann beschränke ich mich in einer zweiten Analyse auf die nicht-sonstigen, gültigen Fälle.

Viele Grüße,
Kutya