Hallo,
ich muss in der Uni eine multivariate Regression rechnen. Ich habe 20 Fälle und sehr viele unabhängige Variablen. Wegen Freiheitsgraden kann ich nur wenige, max. 7 unabhängige Variablen, in die Analyse einführen.
Der Dozent meinte, ich soll ein best-fit-Modell der multivariaten Regression erstellen, also mit dem höchsten Varianzaufklärungspotential und möglichst nur signifikanten Ergebnissen; dazu solle ich puzzeln.
Ich verstehe nicht, welche Variablen und nach welcher Strategie ich die Variablen in die Regression eingeben soll. Willkürlich? Und was ist wichtiger, Varianzaufklärungspotential oder Signifikanzen.
Bei den ersten Variablen ist es immer recht einfach, aber nach drei Variablen in der multivariaten Regression steigt das Varianzaufklärungspotential mit fast jeder zusätzlichen Variable, aber das zerschießt immer die Signifikanzen.
Ich hoffe, jemand versteht mein Problem, und kann mir irgendwie helfen. Nach welchem Muster soll ich die Variablen einführen, was ist wichtiger Aufklärungspotential oder Signifikanzen, nach wievielen Variablen soll ich aufhören usw.
Tausend Dank!