Hallo zusammen,
es geht noch immer um die Clusteranalyse, die ich bereits seit Tagen bearbeite. Leider stehe ich aber gerade vor einem riesigen Problem!
Die Cluster wurden bereits bestimmt. Aus n=1318 Befragten wurden drei Cluster (1) n=352, (2) n=407, (3) n=559 gebildet. Die Gruppen sind weitestgehend homogen und die sind durchaus plausibel. Nun will ich aber noch erkennen, ob die Teilgruppen tatsächlich heterogen zueinander sind. Hierfür weist K-Means (Clusterzentrenanalyse) ja auch eine Anova-Tabelle aus (hier).
Und genau hier liegt der Hund begraben: Wie kann ich erkennen, ob sich die Cluster signifikant unterscheiden, wenn Anova nicht durchgeführt werden kann, weil die Stichprobe nicht normalverteilt ist keine homogenen Varianzen hat? Folgender Link hilft mir leider auch nicht weiter: http://www.uni-graz.at/ilona.papousek/t … s/faq.html Da meine kleinste Zelle 352 Fälle umfasst und die größte 559. Das entspricht nicht 1,5 sondern 1,59.
Dabei liefert Anova durchaus plausible Werte. Alle F sind mitunter deutlich größer als 1 (20 im kleinsten Fall und 2090 im größten) und die Variablen alle signifikant. Das deutet ja stark auf eine saubere Clusterlösung hin, nicht wahr?
Ich habe bereits mit dem Kruskal-Wallis-Test und dem Welch-Test experimentiert. Beide liefern jeweils für jede Variable signifikante Ergebnisse. Aber ist das überhaupt die richtige Vorgehensweise?
Ich komme mit meiner weiteren Auswertung gerade nicht weiter voran, weil ich erst sichergehen möchte, dass die Clusterlösung tatsächlich sinnvoll ist. Kann mir jmd. von euch dazu einen Rat geben?
Ich brauche dringend kompetenten Rat
Viele Grüße
gentix