SPSS Faktorenanalyse mit anschl. Clusteranalyse

Hallo zusammen,

ich habe folgendes Problem:

Und zwar habe ich einen Fragebogen mit mehreren tausend Probanden und hunderten Fragen (Variablen) auszuwerten.

Zuerst möchte ich durch eine Faktorenanalyse die Anzahl der Variablen auf weniger unabhängige Faktoren eingrenzen.

Erste Frage: Wie kann ich jetzt jedem Probanden für jeden Faktor, der sich ja aus mehreren Fragen (Variablen) zusammensetzt, einen Wert zuweisen?

Dabei soll dann praktisch ein verkleinerter Fragebogen herauskommen.

Ist dies möglich?

Danach möchte ich dann mit allen Probanden eine Clusteranalyse durchführen und dadurch Probanden, die einen ähnlich ausgefüllten Fragebogen aufweisen in Gruppen zusammensetzen.

Dadurch sollen dann verschiedene Typen an Probanden zum Vorschein kommen.

Ist dies alles so möglich?

Vielen Dank für Eure Hilfe.
Grüße Kafen

Hallo Kafen,

ich habe folgendes Problem:

Und zwar habe ich einen Fragebogen mit mehreren tausend
Probanden und hunderten Fragen (Variablen) auszuwerten.

Zuerst möchte ich durch eine Faktorenanalyse die Anzahl der
Variablen auf weniger unabhängige Faktoren eingrenzen.

Ja, das klingt plausibel.

Erste Frage: Wie kann ich jetzt jedem Probanden für jeden
Faktor, der sich ja aus mehreren Fragen (Variablen)
zusammensetzt, einen Wert zuweisen?

Dabei soll dann praktisch ein verkleinerter Fragebogen
herauskommen.

Ist dies möglich?

Nun, bei den einzelnen Komponenten, die eine Faktorenanalyse „findet“, handelt es sich gewissermaßen um virtuelle Variablen, denen pro Fall ein bestimmter Wert zu geordnet wird. Dieser Wert kann in der Variablenmatrix gespeichert werden. (Im SPSS-Fenster zur Faktorenanalyse auf die Schaltfläche „Werte“ klicken und „Variablen speichern“ wählen.)

Danach möchte ich dann mit allen Probanden eine Clusteranalyse
durchführen und dadurch Probanden, die einen ähnlich
ausgefüllten Fragebogen aufweisen in Gruppen zusammensetzen.

Dadurch sollen dann verschiedene Typen an Probanden zum
Vorschein kommen.

Dieses Vorgehen ist in Deinem Fall nachvollziehbar. Wichtig ist, dass Du Dir vor der Clusteranalyse darüber in Klaren bist, was die gefundenen Faktoren eigentlich bedeuten - sonst hast Du Schwierigkeiten, die Gruppen zu benennen.

Außerdem solltest Du Dich darauf einstellen, nicht eine, sondern mehrerer Clusteranalysen durchzuführen: Zunächst werden Ausschießer identifiziert (z.B. mit dem single-linkage-Verfahren), erst anschließend ähnlich große Gruppen extrahiert (z.B. mit den Ward-Verfahren). Zum Abschluss wirst Du die Ergebnisse Deiner Gruppierung noch kreuzvalidieren müssen - hierfür verwendet man üblicherweise eine Diskriminanzanalyse.

Zum Abschluss noch einen Buchtipp, in dem Du das alles (besser und ausführlicher) nachlesen kannst. Backhaus et al.: Multivariate Analysemethoden.

Viele Grüße,
Kutya

Hallo kutya,

vielen Dank für die schnelle und gute Hilfe :smile:

Eine weitere Frage zum Vorgehen habe ich noch.

Wenn ich mit allen Variablen zusammen eine Faktorenanalyse durchführe, kommen leider keine sinnvollen Faktoren dabei heraus. Jetzt möchte ich die Variablen in sinnvolle Gruppen untergliedern und je Gruppe eine Faktorenanalyse durchführen. Später dann alle Ergebnisse in einer Tabelle wieder miteinander vereinen.

Ist dies möglich?

Außerdem kommt es in manchen Gruppen vor, dass auch dort keine sinnvollen Faktoren gefunden werden.
Da ich diese Variablen aber nicht unter den Tisch fallen lassen möchte und auch keine unsinnigen Faktoren verwenden möchte, will ich einfach die ursprünglichen Variablen verwenden.

In der Tabelle für die Clusteranalyse wären dann also die Faktoren und „ursprüngliche“ Variablen gemischt.

Ist dies möglich/sinnvoll? Und kann ich die Werte der ursprünglichen Variablen einfach übernehmen oder müssen diese transformiert werden?

Nochmals vielen Dank für die gute Hilfe,

viele Grüße
Kafen

Hallo Kafen,

Wenn ich mit allen Variablen zusammen eine Faktorenanalyse
durchführe, kommen leider keine sinnvollen Faktoren dabei
heraus. Jetzt möchte ich die Variablen in sinnvolle Gruppen
untergliedern und je Gruppe eine Faktorenanalyse durchführen.
Später dann alle Ergebnisse in einer Tabelle wieder
miteinander vereinen.

Ist dies möglich?

Das ist nicht nur möglich, sondern auch sinnvoll. Bei der Faktorenanalyse handelt es sich um eine Verfahren, dass Gemeinsamkeiten zwischen Variablen aufdeckt. Es wird dabei beeinflusst von den Zusammenhängen der Variablen untereinander. Wenn Du zwei große Blöcke von Variablen eingibst, die etwas ähnliches messen, können in der Faktorenanalyse einzelne andere Variablen, die etwas deutlich anderes messen, „unter den Tisch fallen“.

Aus diesem Grund werden beispielsweise in der Konstruktion von psychologischen Tests meist die Items zunächst einzelnen Subskalen zugeordnet, bevor eine Faktorenanalyse dann die Bedeutung der Subskalen für das zu messende Konstrukt prüft.

Außerdem kommt es in manchen Gruppen vor, dass auch dort keine
sinnvollen Faktoren gefunden werden.
Da ich diese Variablen aber nicht unter den Tisch fallen
lassen möchte und auch keine unsinnigen Faktoren verwenden
möchte, will ich einfach die ursprünglichen Variablen
verwenden.

In der Tabelle für die Clusteranalyse wären dann also die
Faktoren und „ursprüngliche“ Variablen gemischt.

Ist dies möglich/sinnvoll?

Das kann sinnvoll sein. Bitte bedenke aber, dass eine Clusteranalyse immer ein Ergebnis liefert - die Frage ist nur, wie sinnvoll das Ergebnis ist. Daher musst Du Dir für jede Variable, die in die Analyse eingeht, sehr sicher darin sein, was sie bedeutet und dass sie nicht übermäßig mit den anderen Variablen der Clusteranalyse korreliert ist.

Und kann ich die Werte der
ursprünglichen Variablen einfach übernehmen oder :müssen diese
transformiert werden?

In eine Clusteranalyse dürfen nur standardisierte Werte eingehen. Nähere Angaben im Buch, dass ich Dir in der letzten Mail ans Herz gelegt habe.

Viele Grüße,
Kutya

1 Like

Hallo Kutya,

Du hast mir sehr geholfen. Vielen Dank :smile:

Eine letzte Frage zur Faktorenanalyse hätte ich noch.

Wenn in einer Gruppe beispielsweise 10 Faktoren gefunden werden. Davon 8 sinnvoll interpretiert werden können, für 2 aber keine sinnvolle Interpretation gefunden werden kann. Kann ich dann nur mit den 8 weiter arbeiten und die 2 „sinnlosen“ Faktoren wegstreichen? Oder würde das das Ergebnis verfälschen und ich muss alle 10 Faktoren verwenden?

Vielen Dank und viele Grüße
Kafen

Hallo,
für mein Gefühl wäre das schon eine deutliche Verzerrung der Ergebnisse. Quasi, als wenn Du bei einer Regressionsanalyse den Error-Term weglassen würdest.

Natürlich kannst Du ein wenig mit dem Auswahlkriterium spielen (z.B. Eigenwert-Grenze hinauf- oder heruntersetzen), was Du dann aber auch rechtfertigen müsstest. Aber errechnete Komponenten weglassen, weil man sie nicht interpretieren kann? Kann mir nicht vorstellen, dass Du eine solche Herangehensweise verteidigen kannst.

„Sinnlose“ Komponenten könnten allerdings darauf hindeuten, dass Du Dir noch einmal Gedanken darüber machen solltest, welche Variablen in die Analyse gehören.

Viele Grüße,
Kutya

1 Like

Hallo Kutya,

vielen Dank nochmals für deine guten Antworten :smile:

habe jetzt Dank deiner Hilfe recht gute Ergebnisse erzielt.

Viele Grüße
Kafen