Statistik Fixed Effects und Random Effects

Guten Tag,
ich habe folgendes kurzes Problem:

In meiner Analyse habe ich zwei Datenreihen einmal die 10 größten und einmal die 3 größten Automobilhersteller in jedem Land. Mein Hausman Test gab für die erste das fixed effects model an und für die zweite das random effects an. Ich habe für beide das random effects benutzt und die Resultate mit fixed effects verglichen, welche sich nur mit den R² reduzierten.

Ist dieser Ansatz richtig? Vor allem kann ich nicht erklären wie es sein kann, dass für eigentlich fast die gleiche Datenreihe zwei verschiedene Modelle vorgeschlagen werden. Ich wäre hier für eine schnelle Einschätzung sehr dankbar.

Vielen Dank im voraus.

Hallo cccapone,

wenn du ein und den selben Zusammenhang modellieren möchtest, solltest du natürlich auch das gleiche Model benutzen.
Woran das Problem liegt, kann ich so nicht sagen. Kannst du einmal Grundlegen schildern was du Modellieren möchtest und welche Variablen du zur Beschreibung zur Verfügung hast?

Ohne weiteres zu wissen bin ich dennoch der Meinung, das ein Hausman test überflüssig sein sollte, da sich die Frage nach Random oder Fix effects i.d.R. aus deren Semantik und Stichproben Art ergibt.

Vielen Dank für die schnelle Antwort.
Ich möchte die Finanzierungsstrategie auf die Rentabilität modellieren. Dazu einige micro aber auch macro Daten.

Müsste in der Regel nicht die 2.Datenreihe die ja zum Teil aus der 1. Datenreihe besteht das gleiche Model vorgeschlagen bekommen? Die 3 größten bestehen ja aus den 10 größten.

Vielen Dank nichmal

Hi,

diese vorgeschlagenen Modelle sind immer so eine Sache.
prinzipiell kann man so vorgehen, dass Effekte, die man vergleichen will (Hersteller) als fixed nehmen soll/muss, Effekte die man nicht vergleichen will aber berücksichtigen möchte (Land) als random.

Grüße,
JPL

Hi!

Ich denke die Antwort liegt in der Definition was fixed Effects und random Effects Modell jeweils als Annahme zugrunde legen.

Beispiel: http://www.meta-analysis.com/downloads/Intro_Models.pdf (keine Angst - die Einleitung genügt um deine Frage zu beantworten)

Stell dir also die Frage was zu erwarten ist und nicht was der Hausmann-Test vorschlägt.

Grüße
Robert

Vielen Dank für Ihre schnelle Antwort. Würde denn der untschiedliche Modelvoschlag ein Fehler in den Samples bedeuten da ja das eine ein Untersample vom ganzen ist. Und wäre die vorgehensweise beide zu benutzen da nur die R² runtergehen auch richtig?

Vielen Dank für die schnelle Antwort. Würde denn der untschiedliche Modelvoschlag ein Fehler in den Samples bedeuten da ja das eine ein Untersample vom ganzen ist. Und wäre die vorgehensweise beide zu benutzen da nur die R² runtergehen auch richtig?

Wenn du unterschiedliche Merkmalsausprägungen (Top 3 / Top 10) hast, kannst du auch nicht vom selben Effekt ausgehen. Dass R² sinkt ist klar, wenn du den Effekt getrennt rechnest.

Die Antwort ist leider ein klassisch jein. Die sind nicht zufällig aber auch nicht fixed (weil Teilmenge). Mir stellt sich ein bisschen die Frage wozu jemand die Top 3 mit den Top 10 vergleichen will - was soll die Aussage daraus sein…

Grüße
Robert

Hallo,

könnte das ein Problem mit dem doch sehr kleinen Datensatz sein? SChau dir doch noch einmal genau an, wie deine Tests ausgegangen sind. VOr allem die Annahme einer Nullhypothese ist bei kleinen DAtensätzen ja immer ein Problem.

Gruß, Andreas

Hallo,
also ok meine Erklärung so macht keinen Sinn.
Es ist eine Datenreihe mit den 2-10 größten (also bis zu den top 10 auch wenn nur 2 vorhanden sind, werden die genommen und zu einem Landes Durchschnitt genommen)in der zweiten Datenreihe nur die 3-5 größten um den ungewichteten ersten Sample zu verbessern.
Die Intention in der ersten Datenreihe war es so viele Länder wie möglich zu haben da die meisten nicht mehr als 2 vorzuweisen hatten. Und in der zweiten zu schauen ob sich die Resultate bei einem mehr gewichteten Sample wiederfinden bzw. erst sichtbar werden.

Also nur um nochmal sicher zu sein:

  1. Es kann durchaus sein dass zwei verschiedene Modelle angebracht sind ( in meinem Falle fixed effects für das Sample für 2-10 größte und random effects für das Sample mit 3-5 größten)??

  2. Die Anwendung von random effects an beiden (für eine bessere Vergleichbarkeit) und anschließend gegenchecken mit fixed effects ( die ergebnisse sind fast gleich halt nur außer r²) ist statistisch gerechfertigt oder eher schwammig??

Vielen vielen Dank Robert

Hi,

Vielen Dank für Ihre schnelle Antwort. Würde denn der
untschiedliche Modelvoschlag ein Fehler in den Samples
bedeuten da ja das eine ein Untersample vom ganzen ist.

Könnte, muss aber nicht. wie klein war den der p-Wert vom Hausman-test? dieser test zeigt ja nur an, dass sich die beiden Verfahren deutlich verschiedene Schätzwerte liefern, welcher davon nun die Daten besser schätzt ist eigentlich noch nicht gesagt.

http://www.uni-bamberg.de/fileadmin/uni/fakultaeten/…

Wenn sich nur das R² verringert, aber die schätzwerte gleich bleiben - was du oben schreibst - dann ist es eigentlich verwunderlich, warum der p-Wert

Du verwirrst mich immer noch mehr. Nochmal: was willst du für eine Aussage treffen? Ob das Verhältnis der Stückzahlen der Autobauer zwischen Ländern, wenn man aus jedem Land die Top 2 bzw. Top 10 nimmt, verändern oder gleichbleiben. Ist es das wirklich?

Was meinst du mit gewichtetem Sample - 3-5 sind ja maximal 3 Autobauer und die zwei größten sind abgeschnitten. Was soll das für eine Aussage werden?

Die 2-10 größten - was bedeutet da der Satz in Klammern? Weshalb rechnest du einen Durchschnitt aus sowas - vor allem wenn du teilweise abschneidest?

. . .
. . .

Grüße
Robert

Alle Faktoren die du hast, die deiner Meinung nach einen direkten Einfluss auf die Rentabilität haben, reproduzierbar sind und eine repräsentative Stichprobe darstellen solltest du als Fix Effekt modellieren.
Der Hausmantest verrät dir nur ob ein Faktor auch einen Einfluss hat (linear), die Semantischen Aspekte werden natürlich nicht abgedeckt. Das Bedeutet insbesondere wenn der Hausman test ein Faktor als Fixed „empfiehlt“ dies noch lange nicht Sinnvoll ist auch tatsächlich so zu modellieren.
Zum Beispiel ist das Herkunftsland typischer Weise ein Random Effekt, auch wenn der Hausmantest etwas anderes sagt. Da es selten eine repräsentative Stichprobe ist (dh. du hast nicht Daten aus ALLEN Ländern) oder es ist nicht sichergestellt das du auch in Zukunft diese Daten haben wirst (also nicht Reproduzierbar).
Ich denke das insbesondere alle Micro- und Makroökonomischen Daten die du hast als Fix Effekt eingehen sollten, Land und Hersteller als Random Effekt.

Zum Modevergleich:
Ich weißt zwar nicht warum (warum eigentlich?) du nun ein Model zu zwei Datensätzen fitten möchtest (wobei einer auch noch eine Teilmenge des anderen ist), aber du solltest nicht mit R² arbeiten. Ich glaube nicht mal das dieser Sinnvoll für Mixed Models definiert ist, außerdem ist dies ein Maß für den Modelfit und kann allein nicht zum Vergleich von Modellen benutzt werden.
Ich bin mir ziemlich sicher das es unnötig ist zwei mal zu fitten, sondern eben nur ein Model zu erstellen, welches auf den gesamten Datensatz gefittet wird. Dies wird dir dann schon verraten, welche Faktoren einen Signifikaten Einfluss auf die Rentabilität haben.

In meiner Analyse habe ich zwei Datenreihen einmal die 10
größten und einmal die 3 größten Automobilhersteller in jedem
Land. Mein Hausman Test gab für die erste das fixed effects
model an und für die zweite das random effects an. Ich habe
für beide das random effects benutzt und die Resultate mit
fixed effects verglichen, welche sich nur mit den R²
reduzierten.

diesen letzten satz verstehe ich nicht, bitte anders formulieren.

wie es sein kann, dass für eigentlich fast die gleiche
Datenreihe zwei verschiedene Modelle vorgeschlagen werden.

ja, „fast“ gleich ist nicht gleich, insofern würde mich das nicht wundern.

www.MaSta-Support.de

Sorry, kann momentan nicht helfen.Gruss Dirk