Regression mit Pfadanalyse

Hallo!

Ich muss demnächst ein Referat über Regression mit Pfadanalyse beschreiben.

Nachdem ich mich im Internet informiert habe, verstehe ich dennoch immer noch nicht das Grundkonzept.
Regression allein ist mir klar.
Allerdings verstehe ich nicht, ob die Pfadanalyse immer nur in Verbindung mit der Regression steht…

Ich hoffe, mir kann jemand helfen???
Schonmal vielen vielen Dank!!!

fragelinchen

Generell ja. Wenn man von Regression spricht, meint man, dass die Variation in einer Variablen auf die Variation einer (Gruppe von) anderer/n Variable/n zurück geführt werden kann. UVs wirken auf die AV.

In einem komplexeren Modell, kann eine AV wiederum die UV einer weiteren Variablen sein, oder komplexer. Eine Variable im Modell kann also sowohl endogen wie auch exogen sein; dies ist bei der Regressionsanalyse nie der Fall.

Man kann (komplexere) Pfadanalysen auch mit SPSS rechnen, allerdings müssen die Modelle saturiert sein ( ein Pfeil von jeder UV auf jede AV) und man muss für jede AV ein getrenntes Modelle rechnen. Sonst muss man das mit einem Programm für Strukturgleichungsmodelle rechnen (zB MPlus, EQS, LISREL, AMOS).

Pfadanalysen sind ein Sonderfall eines Strukturgleichungsmodells, wo jede latente Variable aus einer manifesten Variable gebildet wird.

Gruß, Walter.

Hallo,

ich ahbe mich mit Pfadanalyse leider nie beschäftigt und kann daher nicht wirklich etwas intelligentes dazu sagen. Ich habe es bisher immmer so verstanden, dass Pfadanalyse dafür da ist, Wirkungsrichtungen zu bestimmen im Sinne von „Wirkt A auf B oder wirkt B auf A?“ Dies kann im Rahmen der Regressionsanalyse natürlich sehr nützlich sein, wenn die Kausalkette nicht so eindeutig bekannt ist.

Meiner Meinung nach kann also die Pfadanalyse eine Voranalyse für eine Regressinsbetrachtung sein, ist aber nicht zwingend notwendig bzw. kann sie auch für sich alleine stehen.

Schönen Gruß, Andreas

Aus Wikipedia - das trifft’s ganz gut!

Pfadanalyse
aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Der Begriff Pfadanalyse bezeichnet in der Statistik eine Form der Untersuchung der Abhängigkeiten zwischen Variablen. Im Rahmen der Pfadanalyse werden Pfadmodelle, d.h. theoretisch hergeleitete Modelle kausaler Zusammenhänge zwischen Variablen, empirisch überprüft. Die Pfadanalyse ist Teil der Kausalanalyse.

Noch bevor man zur Modellierung schreitet, müssen die relevanten Kausalfaktoren identifiziert sein. Dieses Problem kann unterschiedlich gelöst werden.[1]

Die Korrelation zwischen zwei Variablen, an sich betrachtet, stellt noch keine Kausalbeziehung dar, sondern liefert lediglich für eine wissenschaftliche Erklärung das „Explanandum“ (siehe Hempel-Oppenheim-Schema). Mit anderen Worten: Die statistische Korrelationsbeziehung an sich liefert keine Erklärung, sondern muss selbst theoretisch erklärt werden.[2]

Zum Beispiel: „Scheidungsraten“ sind von der „Zeit“ abhängig. Die unabhängige Variable „Zeit“ muss erst noch soziologisch interpretiert werden, damit die Erklärung vollständig geliefert werde, etwa: dass sich mit der Zeit der Grad der Verstädterung geändert habe.

Abgrenzung

Die Pfadanalyse gilt als Form einer multiplen, auf Kausalzusammenhänge orientierte Regressionsanalyse, kann jedoch ebenso als Spezialfall eines Strukturgleichungsmodells betrachtet werden, in dem nur einzelne Indikatoren für die jeweiligen Variablen des Kausalmodells eingesetzt werden. Es handelt sich somit um ein Strukturgleichungsmodell, in dem zwar das Strukturmodell vorhanden ist, jedoch auf das Messmodell verzichtet wird.

Grüße!
Robert

Hallo fragelinchen,
von Pfadanalyse habe ich noch nie etwas gehört.
Mich würde interessieren, was Sie über Regression herausgefunden haben?
mfg
IB

Hi,

kurz gesagt:
Pfadanalyse und lineares Strukturgleichungsmodell (SEM) ist dasselbe.

Beim SEM kann man zusätzlich zu manifesten Variablen auch noch latente Variablen, die sich z.B. auf manifeste Variablen auswirken, modellieren. Außerdem können hier zusätzlich zu Korrelationen Ursache-Wirkungsrichtungen angenommen und modelliert werden.

Bei der multiplen Regression hat man „nur“ manifeste Variablen und es wird geprüft wie gut eine AV anhand mehrerer UVs vorhersagbar ist.

Insofern ist SEM „mehr“ als Regression. Für dein Refereat wäre es interessant am selben Bsp (in dem es latente Variablen gibt) eine Regression (eben ohne diese latentne Vars) und eine SEM zu rechnen und die Unterschiede zu zeigen.

Grüße,
JPL

Hi,

Nein, Pfadanalyse im weiteren Sinne (auch unter dem Namen Strukturgleichungsmodelle geführt) ist ein sehr mächtiges Konzept, mit dem man alle linearen Modelle darstellen kann; Regressionsanalysen sind nur ein sehr kleiner Teil. Die Grundidee von Pfadanalysen ist folgende (aus Modellsicht beschrieben, d.h. als würden wir die Welt gerade mit diesem Modell erschaffen): Jeder Knoten (d.h. jede Variable, von der Regressionspfeile aus- oder eingehen) ist eine normalverteilte Variable. Jeder Knoten ohne eingehende Pfeile wird einfach unabhängig gezogen, jeder mit eingehenden Pfeilen wird der Wert der Pfeilursprünge mit den Regressionsgewichten an den Pfeilen multipliziert und aufaddiert, und dann kommt unter Umständen noch eine unabhängige Normalverteilung dazu.

Aus der Sicht von uns mondänen Datensammlern sieht es normalerweise so aus, dass wir einen Datensatz mit ein paar der Variablen haben. Dann suchen wir Parameter des Modelles (also normalerweise die Regressionsgewichte und die Parameter der unabhängigen Verteilungen) so, dass das Modell die höchste Wahrscheinlichkeit hat, unsere Daten zu erzeugen.

Mit diesem Konzept kann man sehr nett viele Sachen darstellen, z.B. klassische 1-variate Regression: der Prädiktor ist ein Knoten, der einen Pfeil auf die vorhergesagte Variable hat, mit dem Regressionsgewicht als Beschriftung.

In Pfadanaylsen kann man recht einfach Variablen hinzufügen; z.B. einen Mediator der Regression. Wir haben eine Ursprungsvariable (sagen wir mal, Hautfarbe) und eine vorhergesagte Variable (z.B. Intelligenz). Eine simple Regressionsanalyse eines Datensatzes, sagen wir, aus dem ländlichen Süden der USA, ein positives Regressionsgewicht vorhersagen, d.h. wir hätten naiv den Eindruck, je dunkler, desto dümmer. Jetzt fügen wir Sozioökonomischen Status (SES) als Mediator hinzu. Unser Pfadmodell ist jetzt ein Dreieck, mit Hautfarbe links mit Pfeilen zu beiden anderen, SES in der Mitte oben mit Pfeil zu IQ, und IQ links mit eingehenden Pfaden von beiden. Jetzt könnten wir finden, dass der Pfeil von Hautfarbe zu SES ein positives Gewicht hat (je dunkler, desto ärmer), und der von SES zu IQ (je ärmer, desto weniger IQ), aber das direkte Gewicht von Hautfarbe zu IQ ist minimal geworden (so dass wir annehmen, dass ist nur Rauschen). Das wäre ein Indiz dafür, dass es in Wirklichkeit die Bildung ist und nicht die Hautfarbe, die unseren Effekt erzeugt hat.

Pfadanalysen in dieser Art haben einige Fallen; z.B. können wir alle Pfeile umdrehen, und wir bekommen immer noch ein gleich guten Fit des Modells, aber natürlich eine gänzlich andere Aussage. Pfadanalysen sind daher nur in den seltensten Fällen ursächlich interpretierbar (soll heißen, wenn mein Pfeil von links nach rechts zeigt, heißt das noch lange nicht, dass die rechte Variable von der linken verursacht wird). Pfadanalysen werden leider oft als Ursachendiagramme Fehlinterpretiert. Für Ursachen-Aussagen braucht man experimentelle Designs oder zumindest zeitliche Abfolgen der Variablen.

Ein zweiter häufiger Fehler ist, Alter als Prädiktor einzusetzen und Regressionsgewichte als Stärken von Entwicklungs- oder Alterungsprozessen zu interpretieren. Das kann ebenso schiefgehen.

Ich hoffe, das hilft Dir erstmal!

Cheers,

Timo

Sorry, aber da kann ich dir leider nicht weiter helfen. Gruß Robert

hallo
da kann ich dir leider nicht helfen.
viele grüsse, rolf

wie ich festgestellt habe, wurde die Frage schon beantwortet.
Gruss
pepo