Umsatzprognose - Regression x-Variable?

Hallo zusammen!

Bei dem Folgenden komme ich einfach nicht wirklich weiter: Wenn ich bspw. den Umsatz prognostizieren/hochrechnen moechte, stehe ich vor einem Raetsel, bzw. weiss nicht, welche Variante/Methode als die geeigneste dafuer erscheint (Trend, Variation, Regression (Trendfunktion), etc.).

Konkret: Ich habe Vergangenheitswerte der letzten Jahre aus einer Bilanz (einschliesslich des 1. Quartals 2013, wobei ich dies bisher ohnehin in den Berechnung unberuecksichtigt gelassen habe). Nun moechte ich gerne bspw. den Umsatz fuer die naechsten zwei Jahre ‚hochrechnen‘. Kann ich eine Regression hierfuer anwenden? Somit muesste ich als abhaengige Variable die jeweilige Jahreszahl angeben, denn die eigentlichen Einflussgroessen wie bspw. Marketingaufwenden sind mir ja ebenfalls nur aus der Vergangenheit bekannt. Nun ja, ich hoffe, dass jeder versteht, was ich meine: Ich verstehe zwar, was die abhaengige Variable ist/sein koennte, jedoch steht mir diesnoch eben nicht zur Verfuegung. Ich koennte hoechstens zwei Regressionen anfertigen, bspw. fuer den Umsatz und fuer die Marketingaufwendungen, bei dem x die Jahreszahlen sind und danach den Umsatz erneut mit den Marketingaufwendungen als dann abhaengige Variable prognostizieren lassen.
Ist es daher oder ansonsten berechtigt, Jahreszahlen als x-Variable zu verwenden, bei einem Vertrauensw’lichkeit von 95 %?

Fuer Antworten waere ich echt dankbar!
Schon mal vielen Dank fuer Eure Unterstuetzung.

Viele Gruesse
Michael

Hallo Michael,

Hallo zusammen!

Bei dem Folgenden komme ich einfach nicht wirklich weiter:
Wenn ich bspw. den Umsatz prognostizieren/hochrechnen moechte,
stehe ich vor einem Raetsel, bzw. weiss nicht, welche
Variante/Methode als die geeigneste dafuer erscheint (Trend,
Variation, Regression (Trendfunktion), etc.).

Da du anscheinend den zeitlichen Verlauf schätzen willst, würde sich eine Zeitreihenanalyse empfehlen.

Konkret: Ich habe Vergangenheitswerte der letzten Jahre aus
einer Bilanz (einschliesslich des 1. Quartals 2013, wobei ich
dies bisher ohnehin in den Berechnung unberuecksichtigt
gelassen habe). Nun moechte ich gerne bspw. den Umsatz fuer
die naechsten zwei Jahre ‚hochrechnen‘. Kann ich eine
Regression hierfuer anwenden? Somit muesste ich als abhaengige
Variable die jeweilige Jahreszahl angeben,

Das ist schonmal Unsinn. Wenn die Jahreszahl die Abhängige sein soll, dann willst du die Jahreszahl erklären?!

Der Umsatz ist die abhängige Variable.

denn die
eigentlichen Einflussgroessen wie bspw. Marketingaufwenden
sind mir ja ebenfalls nur aus der Vergangenheit bekannt. Nun

Also an deiner Stelle würde ich erstmal schauen, ob der Umsatz überhaupt schwankt über die Zeit. Und dann Schritt für Schritt.
Hast du Saisoneffekte?! Also kann man dies mit Dummies auffangen. Hast du Preiseffekte?! Musst du auch berücksichtigen. Wenn das alles drin ist, würde ich mit ARMA-Modellen anfangen. Die sollten in der Regel reichen.

Wenn du das durch hast, kannst du überlegen, ob Marketingefekte einluss haben. Also z.B. im VAR schätzen. Hierführ musst du dirt aber erstmal überlegen, wie der Einfluss sein könnte. Also wie lage brauchen denn Marketingausgaben, bis sie wirken? Stichwort: LAG.

Dann könnte man über Choleskyzerlegung eine Impuls-Antwort-Folge schätzen.

ja, ich hoffe, dass jeder versteht, was ich meine: Ich
verstehe zwar, was die abhaengige Variable ist/sein koennte,
jedoch steht mir diesnoch eben nicht zur Verfuegung. Ich
koennte hoechstens zwei Regressionen anfertigen, bspw. fuer
den Umsatz und fuer die Marketingaufwendungen, bei dem x die
Jahreszahlen sind und danach den Umsatz erneut mit den
Marketingaufwendungen als dann abhaengige Variable
prognostizieren lassen.

So wird das nichts.

Ist es daher oder ansonsten berechtigt, Jahreszahlen als
x-Variable zu verwenden, bei einem Vertrauensw’lichkeit von 95
%?

Ja aber letzlich schätzt du so nichts anderes als einen zeitlichen Trend! Insgesamt sollte man aber weiter gehen. Ist es überhaupt gut die Absolutwerte zu verwenden? Wäre bei Umsatzzahlen nicht besser, die logarithmirten Werte zu schätzen? Außerdem unterstellst du, durch das Regressieren des Umsatzes auf die Marketingausgaben, dass es keine anderen Einflüsse gäbe. Was sehr kritisch ist…

Kontrolliere noch auf den Preis und andere Dinge, die den Umsatz beeinflussen könnten, wie z.B. zukauf von Konkurrenten etc.

Fuer Antworten waere ich echt dankbar!
Schon mal vielen Dank fuer Eure Unterstuetzung.

Viele Gruesse
Michael

Guten Morgen!

Da du anscheinend den zeitlichen Verlauf schätzen willst,
würde sich eine Zeitreihenanalyse empfehlen.

Ja, das koennte man so sagen. Es interessiert mich, wie der Umsatz in den kommenden Jahren bzw. Monaten aussehen koennte, d.h., eine Hochrechnung ist fuer relevant. Jedoch denke ich, dass eben, soweit wie moeglich, auch die bekannten Einfluesse wie bspw. Marketingaufwendungen, Inflationsrate, etc. Einfluss in das Konstrukt finden sollte, um ein angemesseneres Ergebnis zu erhalten. Dachte daher an eine Regressionsanalyse, einer multiplen Regressionsanalyse. Was haeltst Du persoenlich davon? Wichtig waere an dieser Stelle noch zu sagen, dass der Umsatz eher in dem Mass geschaetzt/hochgerechnet werden soll, bei dem der Umsatz ueberzeugen kann. Zwar soll er schoen realistisch sein, aber die Zahlen soll auch ueberzeugen… :smile:
Waere dabei eine Zeitreihenanalyse sinnvoll? Wenn ja, kann man dies mit Excel durchfuehren und werde bei der Zeitreihenanalyse lediglich die Zeit mit beruecksichtigt, denn bei dem Faktor liegt ja zumindest keine Intervallskalierung vor? Auch gibt es mir zu bedenken, dass die Zeitreihenanalyse Trends exponentiell berechnen, ist das richtig?!
Natuerlich - wenn die Zeitreihe die Form f(x) = a+b*x annimmt, entspricht dies ja einer einfachen linearen Trendfunktion, dies ist aber auch zugleich die Frage, ob man lineare Annahme einfach so machen kann und darf, denn dann wird es so sein, dass, wie hier in dem Beispiel, der Umsatz steigt, und steigt, und steigt… Ich hoffe, Du verstehst, was ich meine!? :smile:

Das ist schonmal Unsinn. Wenn die Jahreszahl die Abhängige
sein soll, dann willst du die Jahreszahl erklären?!
Der Umsatz ist die abhängige Variable.

Klar, sorry:
f(x) = Umsatz
x1 = Zahl ; x2 = …

Also an deiner Stelle würde ich erstmal schauen, ob der Umsatz
überhaupt schwankt über die Zeit. Und dann Schritt für
Schritt. Hast du Saisoneffekte?! Also kann man dies mit Dummies
auffangen. Hast du Preiseffekte?! Musst du auch berücksichtigen. Wenn das alles drin ist, würde ich mit ARMA-Modellen anfangen. Die sollten in der Regel reichen.

ARMA-Modellen? Ok. Ist dies vergleichbar mit einer Regressionsanalyse/-geraden? Kann auch Excel dies berechnen?
Wie oben schon gesagt geht es mehr um Ueberzeugung, aber wichtig ist auch, dass ich nebst dem Umsatz weitere Groessen zu berechnen habe, daher sollte ein Formel so sein, dass ich dies auf die anderen Gegebenheitne auch anwenden kann.

Im Uebrigen: Nur mal hypothetisch betrachtet: Wenn ich von 2005 bis 2010 sowohl die Datensaetze vom Umsatz als auch von den Marketingaufwendungen habe und jeweils Regressionen fuer die Jahre 2011-2013 erstelle, kann ich dann im Anschluss, da die geschaetzten Marketingaufwendung bis 2013 somit vorliegen, sie als unabhaengige Variable zu Prognose des Umsatzes nutzen? Die anfaengliche Schaetzung des Umsatzes habe ich somit dann nur dafuer benutzt, um ueberhaupt Werte (die Marketingaufwendung) fuer 2011-2013 zu erhalten, um den Umsatz zu berechnen, oder verfalescht dies eher mein Ergebnis, als dass es alles besser macht?

Wenn du das durch hast, kannst du überlegen, ob Marketingefekte einluss haben. Also z.B. im VAR schätzen. Hierführ musst du dirt aber erstmal überlegen, wie der Einfluss sein könnte. Also wie lage brauchen denn Marketingausgaben, bis sie wirken? Stichwort: LAG.

Was meinst Du mit VAR? Variation? Wenn ja, wuerde ich ja eine exponentielle Trendfunktion berechnen. Auch mit LAG kann ich ad hoch nichts anfangen, jedoch weiss ich, was Du meinst. Da ich nicht die kompletten Marktgegebenheiten kenne, auch was das Interne anbetrifft, denke ich, waere es ratsam, dies unter diesen Umstaenden doch ausser Acht zu lassen…oder?! Wie Du schon sagtest: abgesehen von der Tatsache, dass wahrscheinlich noch viele andere Groessen mehr oder minder Einfluss auf den Umsatz ausueben, bleibt vorerst unbekannt, wann eine unabhaengige Groesse tatsaechlich im zeitlichen Verlauf Einfluss auf die abhaengige Variable nimmt. D.h. in diesem Fall auch, einfach su komplex und zeitaufwendig, bzw. um dies durchzufuehren, fehlt einem wichtige Informationen, die dafuer noetig sind…

Dann könnte man über Choleskyzerlegung eine Impuls-Antwort-Folge schätzen.

Ganz ehrlich, dass kenne ich nicht. :smile: Habe zwar Mathematik im Studium gehabt, aber das ist mir neu, es mangelt dabei schon an dem terminologischen Begriff…

Ist es daher oder ansonsten berechtigt, Jahreszahlen als x-Variable zu verwenden, bei einem Vertrauensw’lichkeit von 95 %?

Ja aber letzlich schätzt du so nichts anderes als einen
zeitlichen Trend! Insgesamt sollte man aber weiter gehen. Ist
es überhaupt gut die Absolutwerte zu verwenden? Wäre bei
Umsatzzahlen nicht besser, die logarithmirten Werte zu
schätzen? Außerdem unterstellst du, durch das Regressieren des
Umsatzes auf die Marketingausgaben, dass es keine anderen
Einflüsse gäbe. Was sehr kritisch ist…

Das ist also tatsaechlich legitim, Jahreszahlen als x-Variable hierbei in Betracht zu siehen, obwohl dies nicht verhaeltnisskaliert ist?
Genau, wie schon gesagt, sehe ich es auch fuer kritisch an, nur bspw. die Marketingaufwendungen als Einflussgroesse vom Umsatz zu sehen…
Bezueglich logarithmischer Funktion, hier faellt mir auch ein, mit relativen Groessen zu arbeiten, bleibt jedoch die Frage offen, wie ich dies machen koennte? In welcher Art und Weise koennte ich die Werte bei Excel transformieren? Vllt. kannst Du mir hierbei behiflich sein, wenn das o.g. von Dir alles negiert wird… J

Schoenen Sonntag!

Viele Gruesse
Michael

Nachtrag - multiple Regression
Guten Morge noch einmal!

Was mir noch eingefallen ist?

Wenn ich jetzt bspw. behaupte, dass der Umsatz nur vom Jahr und von den Marketingaufwendungen abhaengt, und ich gerne eine multiple Regression aufstellen moechte, bleibt das Problem, dass ich zwar fuer die Prognosewerte die Jahreszahlen habe, nocht jedoch die Marketingaufwandungen in Zahlen, auch keine Planwerte oder sonstiges. Dies macht mich auch oder gerade noch stutzig…

Nochmals vielen Dank fuer Deine Hilfe!

Trend-Funktion = Regression
Hallo,

sorry, aber nachdem ich jetzt einiges gelesen habe und viel heurmexperimentiert habe, ist mir gerade das Felgende aufgefallen:
Ist es normal, dass die gleichen Werten herauskommen, wenn man eine die Trendfunktion bzw. die Regressionsfunktion (ich weiss, dies ist ja eigentlich eine Trendfunktion - aber die gleiche?) fuer eine Prognose verwendet?

Darueber hinaus konnte ich feststellen, dass mit der Funktion gleitende Durchschnitte hoeher prognostiztiert wird - hmm. Jetzt versuche ich, nach dem Vorschlag, die x-Variablen, d.h. die Zalen, zu logarithmieren, und dann entsprechend beta, beta1 auszurechnen…oder sollte ich vielleicht die Konstante auf Null gesetzt lassen?

Vielen Dank noch mal!

Viele Gruesse

IMMER mit Konstante Schätzen, denn nur dann kann man gewisse statistische Aussagen über deine Schätzung treffen.

Hallo,

nochmals herzlichen Dank fuer Deine Antwort.

Ich denke, den Umstaenden nach, werde ich entweder eine Regression durchfuehren, bzw. vereinfach dei Funktion Trend benutzen, denn dies entspricht ja der Regression bzw. dem Output (den Werte), oder ich machen eine exponentielle Glaettung 2. Ordnung?
Was raetest Du mir? Denn neben dem Umsatz moechte ich auch fuer weitere Kennzahlen gerne Hochrechnungen durchfuehren, daher scheint mir dieser Weg sowohl effizient als auch effektiv…

Wenn Du zu den anderen Posting noch etwas zu sagen kannst, sehr gerne! :smile:
Ansonsten, wie gesagt, denke ich, ich versuche diesen Weg…mir ist dabei bewusst, dass ich Saisoneffekte, Inflationsrate etc. unberuecksichtigt lasse…

Viele Gruesse
Michae

PS: In Bezug zu der logarithmischen Funktion habe ich annaehrnd die gleiche Werte wie bei der Regression erhalten. Schaetzer und Variation kommen fuer mich nicht infrage, sind mir zu unrealistisch…
Im Uebrigen: durch die Regression bzw. Trendfunktion koennte man durchaus arguementieren, dass die Zahlenreihenanalyse einen linearen Trend noch am ehesten beansprucht, daher auch die Idee mit der exponentiellen Glaettung 2. Ordnung. Die einzige Frage, die dabei noch offen geblieben ist, ob ich lieber 1-alpha=0,95 oder 1-alpha=0,99 dabei waehlen soll?!

IMMER mit Konstante Schätzen, denn nur dann kann man gewisse
statistische Aussagen über deine Schätzung treffen.

Als Konstante habe ich: -2282487796 Kann das realistisch sein? Bis ich da den Schnittpunt mit der Ordniate feststellen werde… :smile:

Hi Michael, wie ich das so überschaue, sind fortgeschrittene Methoden vielleicht nicht durchführbar in deinem Rahmen. Oder eben zu aufwendig auf die schnelle.

Prinzipiell könnte man alles mit Excell machen, allerdings bräuchte man hier etwas mathematisches Know-How. Vielleicht der einfachste weg für dich:

Trage den Umsatz über die Zeit ab. Eine Spalte der Umsatz andere Spalte die Jahreszahl oder so. Dann lässt du Excell einfach eine lineare Regression machen. Im Prinzip ist dies praktikabel. Allerdings muss man mit der Interpretation aufpassen. Wenn du die Jahreszahlen nutzt, schätzt Excel sicher diesen Wert von -2282487796 für die Konstante. Das ist unproblematisch.Allerdings für die Kommunikation etwas komisch. Dann verwende doch einfach mal die Jahre 0 bis 9 statt 2005 bis 2013. Du sagst dann einfach: Im Bezug auf das Ausgangsjahr 2005. Dann sollte der Wert etwas realistischer sein.

Diese Regression ist dann ein einfaches lineares Modell. Es ist hierbei total unproblematisch die Jahreszahlen zu verwenden. Das sieht man am OLS-Schätzer.(theoretischen Beweis lass ich mal weg) :wink:

D aich nicht weiß wie fit du mit Excel bist, kannst du natürlich gleich eine multiple Regression machen. Oder du machst zwei einstufige. Geht also auch.

So wie oben beschrieben, schätzt du einen linearen Trend. Du kannst auch exponetielle Funktionen schätzen. Da ist die Interpretation aber nicht so einfach. Also geht auch, aber ist anspruchsvoller als das lineare Modell. Auch schwerer in einer Präsentation zu erklären.

Dies ist aber, je nach Modell wahl und umrechnung, äquivalent zur logarithmischen Schätzung.

Also mache ein einfaches lineare Modell, das reicht für BWL meist. Und unter statistischen Aspekten auch nicht zwingend falsch…

lg

Hi,

Derartig Umsätze sind wohl eher unrealistisch. Dieser Wert zeigt dir daher, dass deine Trendfunktion nicht geeignet ist die Daten korrekt abzubilden, insbs an den Rändern.
Von daher müsstest du über andere Funktionen nachdenken…
Grüße,
JPL

Lieber JPL,

das ist doch Quatsch. Die Konstante kann man soeinfach garnicht interpretieren. Hat man dafür keine ganz besondere Modellerklärung, dann ist die Konstante völlig irrelevant.

lg

Hi,

Lieber JPL,

das ist doch Quatsch. Die Konstante kann man so einfach
gar nicht interpretieren. Hat man dafür keine ganz besondere
Modellerklärung, dann ist die Konstante völlig irrelevant.

Mit der Kostanten meinen wir (ich zumindest) den Achsenabschnitt. Da du auf der einen Seite sagst, dass man „IMMER mit Konstante Schätzen, denn nur dann kann man gewisse statistische Aussagen über deine Schätzung treffen. … mehr auf http://w-w-w.ms/a4ac3c“ wundert es nun ein wenig, das eben diese Interpretation von dir selber in Abrede gestellt wird.
Wenn man z.B. sigmoid verlaufende Werte linear zu fitten versucht kommt zwangsläufig ein Achsenabschnitt heraus, der Unsinn ist, eben weil die Restriktion der unteren Asymptote fehlt.
Die Modellerklärung der Konstanten ist übrigens sehr einfach: wenn x=0 ist ist y=a, sozusagen der Basiswert, da gibt es gar nicht viel zu deuteln.
wie du selber richtig schreibst sollte man aber für gewisse Daten andere Modelle in Betracht ziehen, obwohl dann die Interpretation der Faktoren ggf komplizierter sein kann.

Grüße,
JPL

Hey,

es ist schon spät und eigentlich wollte ich ins Bett, aber so einen Quatsch kann man nicht so einfach stehen lassen, sonst glauben die Leute es noch.

Hi,

Lieber JPL,

das ist doch Quatsch. Die Konstante kann man so einfach
gar nicht interpretieren. Hat man dafür keine ganz besondere
Modellerklärung, dann ist die Konstante völlig irrelevant.

Mit der Kostanten meinen wir (ich zumindest) den
Achsenabschnitt. Da du auf der einen Seite sagst, dass man
„IMMER mit Konstante Schätzen, denn nur dann kann man gewisse
statistische Aussagen über deine Schätzung treffen. … mehr
auf http://w-w-w.ms/a4ac3c“ wundert es nun ein wenig, das eben
diese Interpretation von dir selber in Abrede gestellt wird.

Du hast es eben nicht verstanden. Nur weil ich etwas in die Schätzung aufnehme heißt es ja nicht, dass ich es interpretieren MUSS. Eigentlich wollte ich die mathematischen Details weglassen, aber du läßt mir keine Wahl.

Wenn man z.B. sigmoid verlaufende Werte linear zu fitten
versucht kommt zwangsläufig ein Achsenabschnitt heraus, der
Unsinn ist, eben weil die Restriktion der unteren Asymptote
fehlt.
Die Modellerklärung der Konstanten ist übrigens sehr einfach:
wenn x=0 ist ist y=a, sozusagen der Basiswert, da gibt es gar
nicht viel zu deuteln.

DAS ist der ultimative Beweis, dass du entweder NULL Ahnung von Schätzungen hast, oder es einfach zu lange her ist.

Also:

Die Konstante wird so geschätzt, dass der Mittelwert der Fehler Null ist. Die hat zwei Vorteile:

  1. Der Erwartungswert der Fehler ist null, und damit ist das Modell im Durchschnitt richtig.
  2. Dadurch werden beide Größen Mittelwertbereinigt. Dies ist bei der ermittlung der Korrelation wichtig, denn es besteht aus zentrierten Momenten. NUR dann, und NUR dann kann man die Varianzzerlegung machen, nur dann hat das R^2 einen Sinn und nur dann kann ich das lineare Modell so interpretieren wie man es macht. Die Konstante selber ist vollkommen irrelevant.

Auch die Extrapolation auf die Ordinate ist schlich Bullshit! Das kann man so nicht interpretieren, da der Standartfehler des geschätzten Parameter berücksichtigt werden muss. Das MODELL gilt nur im Punkt: (X_quer,Y_quer). Also im Schwerpunkt der Wolke.

So bald man abweicht macht man einen Fehler.

Das deine einfache Interpreatation Schwachsinn ist sieht man an einem einfachen Beispiel:

Ein Hersteller von Flatscreens möchte seinen Umsatz schätzen.
Als Daten nimmt man die Jahre 2000 bis 2012. Dann ist das Mittel der Schätzung das Jahr 2006. Der Durchschnittliche Umsatz betrage 10.000.000 € und man Schätze einen Anstieg von 5000€/Jahr. Dies wäre würde bedeuten, dass man im Jahre 1 v.Chr. ( Achsenabschnitt, denn das Jahr Null gab es ja nicht) mit einem Umsatz von -30.000€ rechnen muss.

  1. Damals gab es keine Euros
  2. Damals gab es keine Flatscreens.

Ich denke mal, OHNE MODELL, dass der Umsatz von Flatscreens zu Jesus Geburt genau NULL lag!

Vertrau mir, der Achsenabschnitt hat keine besondere Bedeutung. Ihn kann man nicht und sollte man nicht interpretieren. Naja, außer man hat BWL studiert und davon keine Ahnung. Die machen manchmal sowas…

wie du selber richtig schreibst sollte man aber für gewisse
Daten andere Modelle in Betracht ziehen, obwohl dann die
Interpretation der Faktoren ggf komplizierter sein kann.

Naja, klassich sind die nicht komplizierter. Nur anders. Wenn man Ahnung hat. Es kann sogar sein, dass das lineare Modell völlig flasch ist, und man garnicht mit der OLS-Methode schätzen kann. Also mit den Gleichung des Fehlerquadratsummenminimierung. Aber da zu andern mal mehr

Grüße,
JPL

Hallo,

entschuldige, dass ich erst jetzt antworte…

Hi Michael, wie ich das so überschaue, sind fortgeschrittene Methoden vielleicht nicht durchführbar in deinem Rahmen. Oder eben zu aufwendig auf die schnelle.

Genau, wie gesagt, denke auch, dass solch andere Methoden (zeitlich) nicht moeglich sind, jedoch auch aber nicht wirklich erforderlich hierbei. Hinzu kommt, dass weitere genauer Marktgegebenheiten fehlen.

Prinzipiell könnte man alles mit Excell machen, allerdings bräuchte man hier etwas mathematisches Know-How. Vielleicht der einfachste weg für dich

Ja, den Vorschlag habe ich ja auch angebracht. Regressionsanalyse (hier und in diesem Fall ein lineaerer Trend) oder eine exponentielle Glaettung 2, Ordnung (also einschliesslich der Beruecksichtigung eines angenommenen Trends).

Trage den Umsatz über die Zeit ab. Eine Spalte der Umsatz

Wenn du die Jahreszahlen nutzt, schätzt Excel sicher diesen Wert von -2282487796 für die Konstante. Das ist unproblematisch. Allerdings für die Kommunikation etwas komisch. Dann verwende doch einfach mal die Jahre 0 bis 9 statt 2005 bis 2013. Du sagst dann einfach: Im Bezug auf das Ausgangsjahr 2005. Dann sollte der Wert etwas realistischer sein.

Ja, genau, der Wert soll ja einerseits schon realistisch sein, andererseits aber auch ueberzeugend!
Was mich hierbei stoert bzw. nicht ganz nachvollziehen kann, ist, dass man einfach die Jahre verfaelschen kann, d.h., wie in diesem Vorschlag, 0-9. ist das wirklich fuer das Ergebnis nicht problematisch? Waere dann eine exponentielle Glaettung vielleicht hierbei noch vorteilhaften?!

Diese Regression ist dann ein einfaches lineares Modell. Es :ist hierbei total unproblematisch die Jahreszahlen zu verwenden. Das sieht man am OLS-Schätzer.(theoretischen Beweis lass ich mal weg) :wink:

Ich verstehe, was Du meinst. Du spricht von der Summe der kleinsten Quadrate, Residuen. Denn wundert es mich, dass es keinerlei Relevanz spielt, anderen Zeitzahlen zu benutzen, als die eigentlich. Ansonsten: Ja, ein linaeres Regressionsmodell, eben vereinfacht, da man normalerweise nicht von einem proportionalen Anstieg ausgehen soll. Die XY-scatter hat mir jedenfalls gezeigt, dass angeblich ein Zusammenhang zwischen Jahre und Umsatz besteht… :smile:

Da ich nicht weiß wie fit du mit Excel bist, kannst du natürlich gleich eine multiple Regression machen. Oder du machst zwei einstufige. Geht also auch.

Welcher solltte hierbei der 2., 3. Faktor sein, wenn ich eine multiple Regression in Anspruch nehmen wuerde? Was anderes als die Jahreszahlen (sei es nun 2005-2003 oder 0-9) habe ich ja nicht.

So wie oben beschrieben, schätzt du einen linearen Trend. Du kannst auch exponetielle Funktionen schätzen. Da ist die Interpretation aber nicht so einfach. Also geht auch, aber ist :anspruchsvoller als das lineare Modell. Auch schwerer in einer Präsentation zu erklären.

Aber doch auch genauere, realistischer, oder? Hatte die exponentielle Glaettung 2. Ordnung zu Rate gezogen…

Dies ist aber, je nach Modell wahl und umrechnung, äquivalent zur logarithmischen Schätzung.

Das konnte ich im Ansatz weitestgehend auch feststellen… :smile:

Also mache ein einfaches lineare Modell, das reicht für BWL meist. Und unter statistischen Aspekten auch nicht zwingend falsch…

Nun ja, es muss schon realistisch sein, noch mehr jedoch ueberzeugend!

Vielen Dank nochmal & viele Gruesse

Im Uebrigen
Hallo noch einmal!

Kann ich eigentlich, wenn ich die exponentielle Glaettung 2. Ordnung bspw. fuer 2013 berechnet habe und nun vor habe, 2014 zu schaetzen, das prognostizierte Jahr 2013 in die Kalkulation fuer 2014 mit aufnehmen und so fortlaufend?

Abgesehen von der Variable Umsatz kann ich diesen Weg, also die Zeitreihenanalyse (folge Deinem Beispiel statt 2005-2013 0-9, bezieht sich ja nicht auf das Ergebnis, sondern eher auf die Argumentation), auch fuer andere Faktoren in Erwaegung ziehen, bspw. Eigenkapital oder Anlagevermoegen, da mir auch hier eigentlich keine andere Daten vorliegen…

Hallo,

Hallo,

entschuldige, dass ich erst jetzt antworte…

Kein Problem!

Hi Michael, wie ich das so überschaue, sind fortgeschrittene Methoden vielleicht nicht durchführbar in deinem Rahmen. Oder eben zu aufwendig auf die schnelle.

Genau, wie gesagt, denke auch, dass solch andere Methoden
(zeitlich) nicht moeglich sind, jedoch auch aber nicht
wirklich erforderlich hierbei. Hinzu kommt, dass weitere
genauer Marktgegebenheiten fehlen.

Naja erforderlich hängt prinzipiell von den Daten und der Hypothese die du untersuchst ab. Besser wäre ein Zeitreihenmodell natürlich schon. Zu mindest die Untersuchung, ob es verfälscht, wenn man es nicht berücksichtig.

Wir helfen uns nur mit ein paar Annahmen, damit wir das Problem umgehen, aber eigentlich müssten wir überprüfen, ob die Annahmen gelten.

Prinzipiell könnte man alles mit Excell machen, allerdings bräuchte man hier etwas mathematisches Know-How. Vielleicht der einfachste weg für dich

Ja, den Vorschlag habe ich ja auch angebracht.
Regressionsanalyse (hier und in diesem Fall ein lineaerer
Trend) oder eine exponentielle Glaettung 2, Ordnung (also
einschliesslich der Beruecksichtigung eines angenommenen
Trends).

Trage den Umsatz über die Zeit ab. Eine Spalte der Umsatz

Wenn du die Jahreszahlen nutzt, schätzt Excel sicher diesen
Wert von -2282487796 für die Konstante. Das ist
unproblematisch. Allerdings für die Kommunikation etwas
komisch. Dann verwende doch einfach mal die Jahre 0 bis 9
statt 2005 bis 2013. Du sagst dann einfach: Im Bezug auf das
Ausgangsjahr 2005. Dann sollte der Wert etwas realistischer
sein.

Ja, genau, der Wert soll ja einerseits schon realistisch sein,
andererseits aber auch ueberzeugend!
Was mich hierbei stoert bzw. nicht ganz nachvollziehen kann,
ist, dass man einfach die Jahre verfaelschen kann, d.h., wie
in diesem Vorschlag, 0-9. ist das wirklich fuer das Ergebnis
nicht problematisch? Waere dann eine exponentielle Glaettung
vielleicht hierbei noch vorteilhaften?!

Die Variation der Jahreszahl ist ja lediglich eine Verschiebung der Koordinatenachse entlang der x-Achse. Die Gerade bleibt ja die gleiche. Es ist für eine lineare Regression vollkommen unschädlich sowas zu machen.

Diese Regression ist dann ein einfaches lineares Modell. Es :ist hierbei total unproblematisch die Jahreszahlen zu verwenden. Das sieht man am OLS-Schätzer.(theoretischen Beweis lass ich mal weg) :wink:

Ich verstehe, was Du meinst. Du spricht von der Summe der
kleinsten Quadrate, Residuen. Denn wundert es mich, dass es
keinerlei Relevanz spielt, anderen Zeitzahlen zu benutzen, als
die eigentlich.

Ist ja nicht beliebig geändert. Letzlich änder sich ja nur Schätzer für den Achsenabschnitt. Wie wir die Jahreszahlen nennen dürfte ja keine Rolle spielen. Wenn du den Jüdischen Kalender benutzt sind wir ja schon im Jahr 5000 irgendwas… Das dürfte doch an deiner Analyse nichts ändern, wenn ich die Jahreszahlen umbenenne. Wenn das so wäre, dann hinge ja dein Umsatz davon ab, wie ich das Jahr nenne! Verstehst du?

Ansonsten: Ja, ein linaeres Regressionsmodell,
eben vereinfacht, da man normalerweise nicht von einem
proportionalen Anstieg ausgehen soll. Die XY-scatter hat mir
jedenfalls gezeigt, dass angeblich ein Zusammenhang zwischen
Jahre und Umsatz besteht… :smile:

Was meinst du mit dem Satz? Wieso soll man nicht von einem proportionalen Anstieg ausgehen? Das lineare Modell untersucht doch gerade, wie der proportionale(lineare) Antieg geschätzt werden kann.

Da ich nicht weiß wie fit du mit Excel bist, kannst du
natürlich gleich eine multiple Regression machen. Oder du
machst zwei einstufige. Geht also auch.

Welcher solltte hierbei der 2., 3. Faktor sein, wenn ich eine
multiple Regression in Anspruch nehmen wuerde? Was anderes als
die Jahreszahlen (sei es nun 2005-2003 oder 0-9) habe ich ja
nicht.

Na dann hast du nur eine einfach Regression. Dachte du wolltest noch die Marketingausgaben mit reinnehmen?!

So wie oben beschrieben, schätzt du einen linearen Trend. Du kannst auch exponetielle Funktionen schätzen. Da ist die Interpretation aber nicht so einfach. Also geht auch, aber ist :anspruchsvoller als das lineare Modell. Auch schwerer in einer Präsentation zu erklären.

Aber doch auch genauere, realistischer, oder? Hatte die
exponentielle Glaettung 2. Ordnung zu Rate gezogen…

Naja, ob es genauer bzw. realistischer ist, hängt vom Modell und den Daten ab. Mit Glättung 2. Ordnung meinst du sicher, das Schätzen einer quadratischen Funktion oder? Weil exponetial Smoothing ist eingentlich was anderes.

Dies ist aber, je nach Modell wahl und umrechnung, äquivalent zur logarithmischen Schätzung.

Das konnte ich im Ansatz weitestgehend auch feststellen… :smile:

Na wenn die logarithmierte Gleichung auch gut passt, dann nimm lieber die. Die läßt sich nämlich super Interpretieren. Dein geschätztes Beta ist dann, um wieviel Prozent etwa der Umsatz pro jahr steigt.

Also mache ein einfaches lineare Modell, das reicht für BWL meist. Und unter statistischen Aspekten auch nicht zwingend falsch…

Nun ja, es muss schon realistisch sein, noch mehr jedoch
ueberzeugend!

Vielen Dank nochmal & viele Gruesse

Hallo noch einmal,

damit wir nun zum Abschluss kommen noch das Folgende: :smile:

Die Variation der Jahreszahl ist ja lediglich eine Verschiebung der Koordinatenachse entlang der x-Achse. Die Gerade bleibt ja die gleiche. Es ist für eine lineare Regression vollkommen unschädlich sowas zu machen.

Ok, verstehe. Fuer die Analyse ist es in der Tat irrelevant, nicht jedoch aber fuer die Interpretation!

Was meinst du mit dem Satz? Wieso soll man nicht von einem proportionalen Anstieg ausgehen? Das lineare Modell untersucht doch gerade, wie der proportionale(lineare) Antieg geschätzt werden kann.

Finde halt, ja, ich weiss, will es ja auch einfach halte, bzw. so wird dies bei mittelfristigen Prognosenverfahren auch ueblicherweise in der Praxis gehandhabt, dass die Annahme eines lkinearen (proportionalen) Anstieg nicht wirklich der Realitaet entspricht! Aber ok!

Na dann hast du nur eine einfach Regression. Dachte du wolltest noch die Marketingausgaben mit reinnehmen?!

Ja, eigentlich, war ein Beispiel. Jedoch befuerchte ich, wenn ich bspw. die Marketingausgaben mit reinnehmen, dass das Ergebnis mehr verfaelscht wird als alles andere, und es geht halt eben nun auch einmal um die Ueberzeugung bezueglich der Kennzahlen. Darueber hinaus, denke bzw. weiss ich, dass der Umsatz von vielen andeen Faktoren ebenfalls auch noch detemriniert wird. Daher waere es doch gerechtfertigt, zu sagen, wenn man mittelfristig prognostiziert, dass man bei dem einfachen lineraren Regressionsmodell bleibt, oder? (siehe bitte auch naechste Aeusserung, exponentielle Glaettung)

Naja, ob es genauer bzw. realistischer ist, hängt vom Modell und den Daten ab. Mit Glättung 2. Ordnung meinst du sicher, das Schätzen einer quadratischen Funktion oder? Weil exponetial Smoothing ist eingentlich was anderes.

Doch, doch, eigentliche spreche ich schon von einer exponential smooting, jedoch aber 2. Ordnung, d.h., dass bei dieser Zeitreihenanalyse auch im 2. Schritt der unterstellte lineare Trend (Trendfunktion) mit einbezogen wird. Wuerdest Du dies nicht auch so machen? Im Vergleich bekomme ich hierbei realistischere Ergebnisse heraus.
Und im Bezug zur logarithmischen Funktion kann ich feststellen, dass sich die Werte im Verhaeltnis zur Regressionsgeraden bzw. der Trendfunktion nur marginal voneinander unterscheiden. Ich merke, dass Du dies vermehrt auch auf die Interpretationsschiene schiebst, verstaendlich, jedoch interessiert mich an erster Stelle eben, ob ,bzw. was nicht realistischer und gerade ueberzeugender ist…
Konkret: Kann ich vergleichweise eine exponentielle Glaettung 2. Ordnung durchfuehren, auch bei den anderen Daten, eben bspw. bei den Marketingausgaben, womit ich wieder unterstelle, dass dies von den ‚Jahreszahlen‘ ausschliesslich abhaengen?!

Apropos, die von mir angefertige logarithmische Funktion, habe sie nicht transformiert (in ein lineares Modell), hat einen mehrstelligen negativen Wert bei beta0 und eine absolut mehrstelligen positiven Wert bei der Steigung (beta1)!? Ausserdem: wuerde es ja einen gewaltigen Anstieg bedeuten in Abhaengigkeit von der Jahreszahl, oder?!

Nochmals vielen Dank & vorweg ein schoenes Wochenende!

Hi,

es ist schon spät und eigentlich wollte ich ins Bett, aber so
einen Quatsch kann man nicht so einfach stehen lassen, sonst
glauben die Leute es noch.

vllt solltest du deinen schönheitsschlaf lieber machen, dann wären deine Beiträge vllt auch verständlicher undf weniger anfeindend.

Also:

Die Konstante wird so geschätzt, dass der Mittelwert der
Fehler Null ist. Die hat zwei Vorteile:

  1. Der Erwartungswert der Fehler ist null, und damit ist das
    Modell im Durchschnitt richtig.
  2. Dadurch werden beide Größen Mittelwertbereinigt. Dies ist
    bei der ermittlung der Korrelation wichtig, denn es besteht
    aus zentrierten Momenten. NUR dann, und NUR dann kann man die
    Varianzzerlegung machen, nur dann hat das R^2 einen Sinn und
    nur dann kann ich das lineare Modell so interpretieren wie man
    es macht. Die Konstante selber ist vollkommen irrelevant.

Irgendwo ab hier verzettelst du dich ein wenig und mehr Schlaf wäre sicher gut gewesen.
Das ist auch alles irgendwie richtig, was du schreibst, aber extrem missverständlich.

Auch die Extrapolation auf die Ordinate ist schlich Bullshit!
Das kann man so nicht interpretieren, da der Standartfehler
des geschätzten Parameter berücksichtigt werden muss. Das
MODELL gilt nur im Punkt: (X_quer,Y_quer). Also im Schwerpunkt
der Wolke.
So bald man abweicht macht man einen Fehler.

stimmt alles irgendwo im einzelnen, aber nicht so in dem zusammenhang, wie es schreibst.
klar kann man auf die Ordinate extrapolieren - ob das eine sinnvolle aussage ergibt steht auf einem anderen Blatt.
Das liegt aber nicht am Standardfehler (naja bei dir ist ja auch der Fehler der Stadarte :smile: das ist dann ja vllt was anderes? *SCNR*), sondern daran, dass x=0 ein Punkt sein kann, der inhaltlich keinen Sinn ergibt. Das gilt aber prinzpiell für alle anderen Werte von x ebenso, selbst wenn sie innerhalb der Wolke liegen. Würde man aber gerne eine Prognose über eben diesen Punkt machen und da kommt Unsinn heraus, sollte man sich überlegen, ob lineare Regession das richtige fpr die Fragetstellung ist weil sie ja bekanntermassen gewisse restriktionen nicht berücksichtigen kann.

Zumal diese Aussage auch nicht dazu passt, dass man den achsenabschnitt nicht interepretieren kann. Denn man die Wolke um mean(x) verschieben, dann gilr X_quer = 0 Schwerpunkt und Achsenabschnitt fallen genau zusammen.
Bsp.:

x

das ergibt die Geradengleichung
y = -0.7664*x + 0.1

‚Extrapolation‘ auf die Ordinate ergibt y=0.1 und das ist nun gerade der Schwerpunkt … also so generell wie du es machst kann man das dann doch nicht behaupten.

Die Regressionsgerade ist auch erstmal überall gültig, nicht nur in (X_quer,Y_quer). wobei mir scheint, dass deinem ‚gültig‘ eine etwas andere Defintion zugrundeliegt - bei dir klingt es so, also ob man im schwerpunkt keinen Fehler ‚machen würde‘.
Nun, korrekt ausgedrückt: man hat auch im Schwerpunkt einen Fehler, und dieser wird größer, je weiter man sich entfernt.
Ergänze zu obigem

nd

damit wird klar, dass der preädiktive Wert der Rgression nach aussen hin abnimmt und man daher mit Extrapolationen vorsichtig sein sollte - machen kann man es natürlich trotzdem.

Das deine einfache Interpreatation Schwachsinn ist sieht man
an einem einfachen Beispiel:

Ein Hersteller von Flatscreens möchte seinen Umsatz schätzen.
Als Daten nimmt man die Jahre 2000 bis 2012. Dann ist das
Mittel der Schätzung das Jahr 2006. Der Durchschnittliche
Umsatz betrage 10.000.000 € und man Schätze einen Anstieg von
5000€/Jahr. Dies wäre würde bedeuten, dass man im Jahre 1
v.Chr. ( Achsenabschnitt, denn das Jahr Null gab es ja nicht)
mit einem Umsatz von -30.000€ rechnen muss.

  1. Damals gab es keine Euros
  2. Damals gab es keine Flatscreens.

Ich denke mal, OHNE MODELL, dass der Umsatz von Flatscreens zu
Jesus Geburt genau NULL lag!

Vertrau mir, der Achsenabschnitt hat keine besondere
Bedeutung. Ihn kann man nicht und sollte man nicht
interpretieren. Naja, außer man hat BWL studiert und davon
keine Ahnung. Die machen manchmal sowas…

die würden erstmal deinen Umsatz als Gewinn deklarieren und den negativen Wert auf die Entwicklungskosten zurückführen :smile: dann ergibt das sogar wieder einen Sinn, wobei der Wert dann wohl klein ist.
Dein erstens Bedenken von oben passt aber nicht ganz:
Es ist nur eine Währungsfrage und damit eine andere Skalierung der y-Werte. das ändert zwar den Achsenabschnitt, macht ihn aber nicht per se uniterpretierbar.

Also, ja, vorsicht mit extrapolation insbesondere auf punkte die sehr weit weg sind vom Schwerpunkt. wenn man aber eben genau das vorhat und es kommt Unsinn heraus sollte man sich über auswegen Gedanken machen, z.b. andere Modelle (nicht linear, höhere Polynome, was auch immer).

Grüße,
JPL

Hallo, diese nachricht mag vielleicht etwas böse klingen, das ist sie aber nicht. Nur sehr sehr offen und ehrlich.

Hallo noch einmal,

damit wir nun zum Abschluss kommen noch das Folgende: :smile:

Die Variation der Jahreszahl ist ja lediglich eine
Verschiebung der Koordinatenachse entlang der x-Achse. Die
Gerade bleibt ja die gleiche. Es ist für eine lineare
Regression vollkommen unschädlich sowas zu machen.

Ok, verstehe. Fuer die Analyse ist es in der Tat irrelevant,
nicht jedoch aber fuer die Interpretation!

Die Interpretation ist komplett die selbe. Du änderst nichts. Das ist so typisch BWL-Niveau. Wollen groß empirisch arbeiten und tun, und machen dann nur Scheiße.

Was meinst du mit dem Satz? Wieso soll man nicht von einem proportionalen Anstieg ausgehen? Das lineare Modell untersucht doch gerade, wie der proportionale(lineare) Antieg geschätzt werden kann.

Finde halt, ja, ich weiss, will es ja auch einfach halte, bzw.
so wird dies bei mittelfristigen Prognosenverfahren auch
ueblicherweise in der Praxis gehandhabt, dass die Annahme
eines lkinearen (proportionalen) Anstieg nicht wirklich der
Realitaet entspricht! Aber ok!

Also: Entweder willst du es richtig machen, oder garnicht. Wir bewegen uns schon ahrt am Rand der Legalität. Wenn wir jetzt noch mehr an allem rumbasteln, kannst du die ganze Regression vergessen. Wir könne so lange rumbasteln bis alles so ausschaut wie man es biluig verkaufen kann, aber dann ist das alles MIST und FALSCH. Ich weiß das 90% der BWL-Absolventen genau das machen, aber dann brauchste die Hilfe hier nicht.

Na dann hast du nur eine einfach Regression. Dachte du wolltest noch die Marketingausgaben mit reinnehmen?!

Ja, eigentlich, war ein Beispiel. Jedoch befuerchte ich, wenn
ich bspw. die Marketingausgaben mit reinnehmen, dass das
Ergebnis mehr verfaelscht wird als alles andere, und es geht
halt eben nun auch einmal um die Ueberzeugung bezueglich der
Kennzahlen. Darueber hinaus, denke bzw. weiss ich, dass der
Umsatz von vielen andeen Faktoren ebenfalls auch noch
detemriniert wird. Daher waere es doch gerechtfertigt, zu
sagen, wenn man mittelfristig prognostiziert, dass man bei dem
einfachen lineraren Regressionsmodell bleibt, oder? (siehe
bitte auch naechste Aeusserung, exponentielle Glaettung)

Wenn die Aufnahme der Marketingausgaben deine Schätzer total verändert ist es ein Zeichen, dass die Marketingausgaben gaaaanz wichtig sind. Du machst es also genau falsch. Du läßt es raus, weil es was erklärt.

Du redest von Überzeugung. Das ist typisch für das Management, die Ergebnisse sind vollkommen irrelevant. Nur Selbstdarstellung zählt.

Naja, ob es genauer bzw. realistischer ist, hängt vom Modell und den Daten ab. Mit Glättung 2. Ordnung meinst du sicher, das Schätzen einer quadratischen Funktion oder? Weil exponetial Smoothing ist eingentlich was anderes.

Doch, doch, eigentliche spreche ich schon von einer
exponential smooting, jedoch aber 2. Ordnung, d.h., dass bei
dieser Zeitreihenanalyse auch im 2. Schritt der unterstellte
lineare Trend (Trendfunktion) mit einbezogen wird. Wuerdest Du
dies nicht auch so machen? Im Vergleich bekomme ich hierbei
realistischere Ergebnisse heraus.

Ich dachte du willst keine Zeitreihenanalyse machen?! WAS den nun? Vermische nicht die Verfahren, dann kommt nur Grütze raus.

Und im Bezug zur logarithmischen Funktion kann ich
feststellen, dass sich die Werte im Verhaeltnis zur
Regressionsgeraden bzw. der Trendfunktion nur marginal
voneinander unterscheiden. Ich merke, dass Du dies vermehrt
auch auf die Interpretationsschiene schiebst, verstaendlich,
jedoch interessiert mich an erster Stelle eben, ob ,bzw. was
nicht realistischer und gerade ueberzeugender ist…

Wäre es an erste Stelle nicht wichtig, das deine Schätzung RICHTIG ist!?

Konkret: Kann ich vergleichweise eine exponentielle Glaettung
2. Ordnung durchfuehren, auch bei den anderen Daten, eben
bspw. bei den Marketingausgaben, womit ich wieder unterstelle,
dass dies von den ‚Jahreszahlen‘ ausschliesslich abhaengen?!

Du kannst alles machen, was du willst. Die Frage ist nur, ob es sinnvoll ist. Und genau das bezweifel ich.

Apropos, die von mir angefertige logarithmische Funktion, habe
sie nicht transformiert (in ein lineares Modell), hat einen
mehrstelligen negativen Wert bei beta0 und eine absolut
mehrstelligen positiven Wert bei der Steigung (beta1)!?

Was meinst du damit, du hast sie nicht transformiert? Logarithmierung ist eine stetig monotone Transformation. Den negativen Wert von Beta0 habe ich dir doch schon erklärt.

Ausserdem: wuerde es ja einen gewaltigen Anstieg bedeuten in
Abhaengigkeit von der Jahreszahl, oder?!

Na ich kenne die Daten und die genauer Zahlen nicht, aber wenn beta1 groß ist, hast du einen großen Anstieg.

Nochmals vielen Dank & vorweg ein schoenes Wochenende!

Hi,

es ist schon spät und eigentlich wollte ich ins Bett, aber so
einen Quatsch kann man nicht so einfach stehen lassen, sonst
glauben die Leute es noch.

vllt solltest du deinen schönheitsschlaf lieber machen, dann
wären deine Beiträge vllt auch verständlicher undf weniger
anfeindend.

Ich bin nicht anfeindend, nur ehrlich. Und wenn ich deins lese, kriege ich im Halbschlaf mehr auf die Reihe als du es anscheind je könntest zu diesem Thema.

Also:

Die Konstante wird so geschätzt, dass der Mittelwert der
Fehler Null ist. Die hat zwei Vorteile:

  1. Der Erwartungswert der Fehler ist null, und damit ist das
    Modell im Durchschnitt richtig.
  2. Dadurch werden beide Größen Mittelwertbereinigt. Dies ist
    bei der ermittlung der Korrelation wichtig, denn es besteht
    aus zentrierten Momenten. NUR dann, und NUR dann kann man die
    Varianzzerlegung machen, nur dann hat das R^2 einen Sinn und
    nur dann kann ich das lineare Modell so interpretieren wie man
    es macht. Die Konstante selber ist vollkommen irrelevant.

Irgendwo ab hier verzettelst du dich ein wenig und mehr Schlaf
wäre sicher gut gewesen.
Das ist auch alles irgendwie richtig, was du schreibst, aber
extrem missverständlich.

WAS ist denn daran flsch? ANTWORT: NIX. Nur weil du behauptest ich verzettel mich, weil du es nicht verstehst, ist kein Argument.

Auch die Extrapolation auf die Ordinate ist schlich Bullshit!
Das kann man so nicht interpretieren, da der Standartfehler
des geschätzten Parameter berücksichtigt werden muss. Das
MODELL gilt nur im Punkt: (X_quer,Y_quer). Also im Schwerpunkt
der Wolke.
So bald man abweicht macht man einen Fehler.

stimmt alles irgendwo im einzelnen, aber nicht so in dem
zusammenhang, wie es schreibst.

Auch im Zusammenhang stimmt es, und es stimmt nicht nur irgendwo. Sonder HIER stimmt es.

klar kann man auf die Ordinate extrapolieren - ob das eine
sinnvolle aussage ergibt steht auf einem anderen Blatt.

Nee, genau darum geht es doch mit dem Ordinatenabschnitt. Was anderes als eine Extrapolation ist das nicht.

Das liegt aber nicht am Standardfehler (naja bei dir ist ja
auch der Fehler der Stadarte :smile: das ist dann ja vllt was
anderes? *SCNR*), sondern daran, dass x=0 ein Punkt sein kann,
der inhaltlich keinen Sinn ergibt. Das gilt aber prinzpiell
für alle anderen Werte von x ebenso, selbst wenn sie innerhalb
der Wolke liegen. Würde man aber gerne eine Prognose über eben
diesen Punkt machen und da kommt Unsinn heraus, sollte man
sich überlegen, ob lineare Regession das richtige fpr die
Fragetstellung ist weil sie ja bekanntermassen gewisse
restriktionen nicht berücksichtigen kann.

Zumal diese Aussage auch nicht dazu passt, dass man den
achsenabschnitt nicht interepretieren kann. Denn man die Wolke
um mean(x) verschieben, dann gilr X_quer = 0 Schwerpunkt und
Achsenabschnitt fallen genau zusammen.

Das ist ja auch ein anderes Modell.Und ich sagte im Allgemeinen kann man es nicht interpretieren. Klar kann ich einne Transformation durchführen… Aber das ist dann ja eine andere Situation.

Bsp.:

x

das ergibt die Geradengleichung
y = -0.7664*x + 0.1

‚Extrapolation‘ auf die Ordinate ergibt y=0.1 und das ist nun
gerade der Schwerpunkt … also so generell wie du es machst
kann man das dann doch nicht behaupten.

Kann man, da ich ja gesagt habe, im allgemeinen kann man es nicht. Klar, wenn ich die Daten so transformieren, dass die Ordinate durch den Schwerpunkt der Wolke geht, dann passt es.

Die Regressionsgerade ist auch erstmal überall gültig, nicht
nur in (X_quer,Y_quer). wobei mir scheint, dass deinem
‚gültig‘ eine etwas andere Defintion zugrundeliegt - bei dir
klingt es so, also ob man im schwerpunkt keinen Fehler ‚machen
würde‘.

Daran sieht man, dass du wirklich NULL von der Sache verstehst. Wenn man sie den Schätzer anschaut sieht man, dass es so genaut ist dass der fehler im Mittelpunkt der Wolke genau 0 ist. Der wird so kontruiert… Die wahren Fehler werden wir eh nie kennen.

Nun, korrekt ausgedrückt: man hat auch im Schwerpunkt einen
Fehler, und dieser wird größer, je weiter man sich entfernt.
Ergänze zu obigem

FALSCH. Denn man weiß garnicht wie der Fehler ist! (Kanna uch Korinthen kacken wie du)

nd

damit wird klar, dass der preädiktive Wert der Rgression nach
aussen hin abnimmt und man daher mit Extrapolationen
vorsichtig sein sollte - machen kann man es natürlich
trotzdem.

Das deine einfache Interpreatation Schwachsinn ist sieht man
an einem einfachen Beispiel:

Ein Hersteller von Flatscreens möchte seinen Umsatz schätzen.
Als Daten nimmt man die Jahre 2000 bis 2012. Dann ist das
Mittel der Schätzung das Jahr 2006. Der Durchschnittliche
Umsatz betrage 10.000.000 € und man Schätze einen Anstieg von
5000€/Jahr. Dies wäre würde bedeuten, dass man im Jahre 1
v.Chr. ( Achsenabschnitt, denn das Jahr Null gab es ja nicht)
mit einem Umsatz von -30.000€ rechnen muss.

  1. Damals gab es keine Euros
  2. Damals gab es keine Flatscreens.

Ich denke mal, OHNE MODELL, dass der Umsatz von Flatscreens zu
Jesus Geburt genau NULL lag!

Vertrau mir, der Achsenabschnitt hat keine besondere
Bedeutung. Ihn kann man nicht und sollte man nicht
interpretieren. Naja, außer man hat BWL studiert und davon
keine Ahnung. Die machen manchmal sowas…

die würden erstmal deinen Umsatz als Gewinn deklarieren und
den negativen Wert auf die Entwicklungskosten zurückführen :smile:
dann ergibt das sogar wieder einen Sinn, wobei der Wert dann
wohl klein ist.
Dein erstens Bedenken von oben passt aber nicht ganz:
Es ist nur eine Währungsfrage und damit eine andere Skalierung
der y-Werte. das ändert zwar den Achsenabschnitt, macht ihn
aber nicht per se uniterpretierbar.

Blödsinn, das hat doch mit der Währung nichts zu tun. Du hast den Sinn der Ausage NULL verstanden.

Also, ja, vorsicht mit extrapolation insbesondere auf punkte
die sehr weit weg sind vom Schwerpunkt. wenn man aber eben
genau das vorhat und es kommt Unsinn heraus sollte man sich
über auswegen Gedanken machen, z.b. andere Modelle (nicht
linear, höhere Polynome, was auch immer).

Deiner Aussage zufolge verstehe ich dich nicht. Du erklärst gerade über Seiten, warumd er Achsenabschnitt so toll ist und total gut zu interpretieren etc. Und dann sowas? Was denn nun? Scheiße, wenn man nur Halbwissen hat oder?!

Grüße,
JPL