Ausreißer

Guten Tag,
Ich habe eine Frage, zu der ich in der Literatur keine Antwort finde. Ich habe eine CFA mit AMOS gerechnet. Wie es Tabachnick & Fidell (2001) empfehlen, habe ich zur Identifikation multivariater Ausreißer die Mahalanobis-Distanz berechnen lassen und die Fälle ausgeschlossen, die den kritischen chi-Quadrat-Wert mit p

Guten Tag,
Ich habe eine Frage, zu der ich in der Literatur keine

Antwort

finde. Ich habe eine CFA mit AMOS gerechnet. Wie es

Tabachnick

& Fidell (2001) empfehlen, habe ich zur Identifikation
multivariater Ausreißer die Mahalanobis-Distanz

berechnen

lassen und die Fälle ausgeschlossen, die den

kritischen

chi-Quadrat-Wert mit p

Ich habe eine CFA mit AMOS gerechnet. Mahalanobis
chi-Quadrat-Wert mit p

Hallo,
was Ausreisser betrifft gibt es grundsaetzlich zwei
Ansaetze. Die eine ist, dass man einfach eine Verteilung
annimmt, die solche Ausreisser produziert. Also eine die
Heavy Tails hat (e.g. Cauchy oder Double-Normal). Davon
hast Du aber nicht viel, da CFA natuerlich von einer
multivariaten Normalverteilung ausgeht.
Die andere Variante ist das sog. Contamination Modell,
d.h. Deine Daten sind eine Mischung aus zwei
unterschiedlichen Normalverteilungen (alpha*N(m1,s1) +
(1-alpha)*N(m2,s2)). Jetzt ist Dein alpha mit 15% nicht
gerade vernachlaessigenswert. Ne Quelle kenne ich jetzt
nicht (und kann mir auch keine serioese Quelle
vorstellen, da dass natuerlich immer vom Gegenstand
abhaengt). Ich wuerde einfach beide Modelle rechnen und
sagen, dass das ohne Ausreisser sich Deines Erachtens
besser an die Daten anpasst.
Beste Gruesse aus Rotterdam,
Stefan

Guten Tag,
Ich habe eine Frage, zu der ich in der Literatur keine

Antwort

finde. Ich habe eine CFA mit AMOS gerechnet. Wie es

Tabachnick

& Fidell (2001) empfehlen, habe ich zur Identifikation
multivariater Ausreißer die Mahalanobis-Distanz

berechnen

lassen und die Fälle ausgeschlossen, die den kritischen
chi-Quadrat-Wert mit p

Hallo,

Ich kenne mich mit den Methoden, die Du angewandt, nicht aus. Persönlich finde ich aber 15% Ausreisser viel zuviel. Aber wenn Du den Grund erklären kannst, warum das Ausreisser sind, dann hätte ich keine Bedenken, diese zu entfernen. Vielleicht kannst Du die Ausreisser ja separat analysieren (z.B. Verteilungen anschauen) und mit den anderen 85% vergleichen. Falls sich irgend eine Variable auffällig verhält, kannst Du den Grund für den Ausreisser herausfinden. Oder du kannst den Ausreissern und dem Rest eine Dummy-Variable A/nichtA zufügen und im Modell integrieren. Andererseits, wie wirken sich die Ausreisser auf die Kennzahlen aus?
Sorry, für das ich Dir keine konkrete Antwort geben kann.

Hallo Heiner,

bei der Identifizierung von Ausreißern gibt es keine einheitliche Regel. Ich kenne z.B. die Identifizierung von Ausreißern über Boxplots. Hierbei werden Ausreißer meistens als diejenigen Werte definiert, die mehr als 1,5*IQA nach unten vom 1. Quartil bzw. 1,5*IQA nach obem vom 3. Quartil entfernt sind.

Beste Grüße

Wenn es so viele Ausreisser gibt, dann sind die der Analyse zugrundeliegenden Verteilungs-Annahmen vermutlich sehr deutlich verletzt.