Produktmittelwert vs. Mittelwertprodukt

Hallo,
ich scheitere gerade an einem einfach zu erklärenden Problem:
Ich habe je eine Stichprobe von 2 Zufallsgrößen A und B, die paarweise auftreten, aber unabhängig voneinander sind. Mich interessieren immer die Produkte Ai*Bi.

Jetzt möchte ich wissen, welcher Unterschied sich ergibt, wenn ich einmal den Mittelwert(Ai*Bi) für alle Paare i = 1 bis n bilde oder den Mittelwert(A) * Mittelwert(B). Ich brauche eine allgemeine Lösung.

Wikipedia behauptet, der „Erwartungswert des Produkts von n Zufallsvariablen“ sei gleich dem „Produkt der Erwartungswerte der einzelnen Zufallsvariablen“.

Wenn ich aber zum Beispiel A (1,3,5) und B (2,4,6) nehme, ist das Produkt der Mittelwerte (3*4) gleich 12. Der Mittelwert der Produkte (2,12,30) ist aber 44/3.

Mir fehlt leider das nötige Rüstzeug, ich vermute aber, dass der Unterschied zwischen beiden Varianten von der Varianz der Zufallsvariablen abhängt. Ach ja, Normalverteilung sei mal angenommen (dürfte aber keine Rolle spielen).

Für Hilfe wäre ich sehr dankbar.
Andre

hi,

Wikipedia behauptet, der „Erwartungswert des Produkts von n
Zufallsvariablen“ sei gleich dem „Produkt der Erwartungswerte
der einzelnen Zufallsvariablen“.

„Wenn die Zufallsvariablen Xi stochastisch voneinander unabhängig sind“ (zitat wikipedia) … und nur dann.

Wenn ich aber zum Beispiel A (1,3,5) und B (2,4,6) nehme, ist

inwieweit sind das „zufallsvariablen“? das sind 3-tupel von zahlen. und zwar ziemlich abhängige, nämlich B = A + 1.

m.

Hallo,

Jetzt möchte ich wissen, welcher Unterschied sich ergibt, wenn
ich einmal den Mittelwert(Ai*Bi) für alle Paare i = 1 bis n
bilde oder den Mittelwert(A) * Mittelwert(B). Ich brauche eine
allgemeine Lösung.

Allgemein: Im Mittel ist dieser Unterschied Null.

Wikipedia behauptet, der „Erwartungswert des Produkts von n
Zufallsvariablen“ sei gleich dem „Produkt der Erwartungswerte
der einzelnen Zufallsvariablen“.

Korrekt, falls die Zufallsvariablen voneinander unabhängig sind.

Wenn ich aber zum Beispiel A (1,3,5) und B (2,4,6) nehme, ist
das Produkt der Mittelwerte (3*4) gleich 12. Der Mittelwert
der Produkte (2,12,30) ist aber 44/3.

Ja, hier hast Du eine konkrete Stichprobe, und eine Stichprobe hat einen Stichprobenfehler. Wenn der Stichprobenumfang aber sehr groß wird, dann wird der Unterschied in den Methoden der Berechnung immer geringer. Der Erwartungswert ist ja, wie Du vielleicht weißt, nicht einfach so der Mittelwert, sondern der theoretische Mittelwert einer theoretischen Grundgesamtheit, die unendlich groß ist.

Mir fehlt leider das nötige Rüstzeug, ich vermute aber, dass
der Unterschied zwischen beiden Varianten von der Varianz der
Zufallsvariablen abhängt. Ach ja, Normalverteilung sei mal
angenommen (dürfte aber keine Rolle spielen).

Soweit auch richtig. Die Varianz des Produkts ist übrigends VAR(XY) = VAR(X)*E(Y)*VAR(Y)*E(X). Die Herleitung dafür habe ich nicht, wäre aber auch dankbar, wenn die jemand nachliefern könnte :smile:

LG
Jochen

Hallo und vielen Dank für die Antworten,
jetzt steigt bei mir die Hoffnung, zu einer Lösung zu gelangen.
Das Problem liegt (Achtung, Praxis!) eben ganz genau darin, dass es sich in meinem Fall immer um konkrete Stichproben handeln wird. Und für die, so vermute ich, lässt sich immer eine Abhängigkeit konstruieren.
Für mich ist jedoch interessant, wie sehr das Ergebnis der einen („Aushilfs-“) Methode von dem der anderen („richtigen“) Methode abweicht. Und das würde ich gerne explizit berechnen. Die Antwort, dass ich ja einfach beide Methoden anwenden und die Ergebnisse vergleichen kann, gilt leider, wiederum aus praktischen Gründen, nicht. Die Aufgabe ist also, den Unterschied (Differenz?) zwischen beiden Methoden explizit (mittels der Varianz der Einzelstichproben?) auszudrücken. Dazu bin ich nicht in der Lage.
Aber dankbar für jeden weiteren Hinweis! :smile:
Gruß - Andre

Hi Andre,

Hallo und vielen Dank für die Antworten,
jetzt steigt bei mir die Hoffnung, zu einer Lösung zu
gelangen.
Das Problem liegt (Achtung, Praxis!) eben ganz genau darin,
dass es sich in meinem Fall immer um konkrete Stichproben
handeln wird. Und für die, so vermute ich, lässt sich immer
eine Abhängigkeit konstruieren.

(Achtung, Theorie! :wink:): einen Korrelationskeoffizienten von genau 0 zu bekommen ist auch unwahrscheinlicher als einen != 0 zu bekommen.

Für mich ist jedoch interessant, wie sehr das Ergebnis der
einen („Aushilfs-“) Methode von dem der anderen („richtigen“)
Methode abweicht. Und das würde ich gerne explizit berechnen.

Da kommt man leider nicht weit. Also kannst du es nur damit probieren, daten zu simulieren, beide Methoden zu berechnen und so die Abweichungen in beide Richtungen möglichweise einzuschränken.

Die Antwort, dass ich ja einfach beide Methoden anwenden und
die Ergebnisse vergleichen kann, gilt leider, wiederum aus
praktischen Gründen, nicht. Die Aufgabe ist also, den
Unterschied (Differenz?) zwischen beiden Methoden explizit
(mittels der Varianz der Einzelstichproben?) auszudrücken.

Aus deinem Ursprungsposting würde ich ablesen, dass du einen Zufallsprozess hast, der dir zuerst zwei Zahlen liefert, die für sich genommen aber nicht von Interesse sind. Vielmehr geht es um das Produkt der ebdien Zahlen und deren Verteilung. Also kannst du das auch als eine neue Zufallsvariable auffassen und dann direkt die relevanten Größen berechnen.
Der Weg über die Ai und Bi nützt dir nur dann etwas, wenn du etwas über die Verteilung von A B a priori weißt.
Für den Fall der von dir angesprochenen Normalverteilungen ergibt sich hier eine Lösung:
http://www.mathematik.uni-ulm.de/stochastik/lehre/ws…
(wohlgemerkt für normierte ZV).

Mir fehlt leider das nötige Rüstzeug, ich vermute aber, dass
der Unterschied zwischen beiden Varianten von der Varianz der
Zufallsvariablen abhängt. Ach ja, Normalverteilung sei mal
angenommen (dürfte aber keine Rolle spielen).

Soweit auch richtig. Die Varianz des Produkts ist übrigends
VAR(XY) = VAR(X)*E(Y)*VAR(Y)*E(X). Die Herleitung dafür habe
ich nicht, wäre aber auch dankbar, wenn die jemand nachliefern
könnte :smile:

siehe z.B. hier für weitere Hinweise:
http://www.gil.de/dokumente/berichte/DDD/R9_02-0021.pdf

Grüße,
JPL

Hallo JPL,

siehe z.B. hier für weitere Hinweise:
http://www.gil.de/dokumente/berichte/DDD/R9_02-0021.pdf

Danke!

LG
Jochen

Hallo JPL

siehe z.B. hier für weitere Hinweise:
http://www.gil.de/dokumente/berichte/DDD/R9_02-0021.pdf

Ich glaube, das ist nicht nur eine tolle Übersicht sondern gibt auch gleich die Lösung für mein Problem (Gl.1): E(X*Y)=E(X)*E(Y)+cov(X,Y).
Der Unterschied zwischen beiden Methoden ist bei abhängigen Zufallsvariablen (und damit wohl auch bei Stichproben?) einfach die Kovarianz.
Bitte um Korrektur, falls es doch nicht so einfach ist, ansonsten
Recht Herzlichen Dank allen die sich die Zeit genommen haben!

Grüße - Andre

Ich glaube, das ist nicht nur eine tolle Übersicht sondern
gibt auch gleich die Lösung für mein Problem (Gl.1):
E(X*Y)=E(X)*E(Y)+cov(X,Y).
Der Unterschied zwischen beiden Methoden ist bei abhängigen
Zufallsvariablen (und damit wohl auch bei Stichproben?)
einfach die Kovarianz.
Bitte um Korrektur, falls es doch nicht so einfach ist,

Aber gerne doch.

Die Existenz von Kovarianz hat nichts mit der Größe der Stichproben zu tun. Entweder die Variablen sind unabhängig, dann ist der Erwartungswert der Kovarianz Null (so ist sie definiert), oder sie sind abhängig, dann ist der Erwartungswert größer Null.

Ich glaube, Dir ist der Unterschied zwischen Stichprobe und Grundgesamtheit nicht so recht klar.

In deinen Stichproben hast du einen limitierten Datensatz, der einen kleinen Teil einer Grundgesamtheit wiedergibt. Wenn Du dir EINEN BESTIMMTEN solchen Datensatz anschaust, dann hat dieser Datensatz num mal bestimmte Eigenschaften wie Mittelwerte, Varianzen und auch eine Kovarianz. Das sind alles ganz konkrete Werte und die gelten ganz konkret für DIESEN Datensatz. Ein ANDERER Datensatz liefert andere Werte. Daher ist es meist nicht so wirklich interessant, wie die Werte für einen bestimmten Datensatz, eine Stichprobe aussehen, weil es schon bei der nächsten Stichprobe recht anders sein kann. Nun kann man dank statistischer Verfahren aber die Information aus einer Stichprobe benutzen, um Aussagen über diese Parameter in der Grundgesamtheit zu treffen. Ich denke, dass das eigentlich das ist, was Du machen willst. Das solltest Du mal genauer formulieren.

LG
Jochen

Hallo,

ich antworte gerne auch noch auf diese Anmerkungen. Auch wenn ich kein Statistiker bin, ist mir der Unterschied zwischen Grundgesamtheit und Stichprobe schon bewusst. Ich wollte vermeiden, das gesamte Problem im einzelnen zu schildern und hatte versucht es bereits ausreichend abstrakt (mathematisch?) zu formulieren. In meinem Fall gibt es eben eigentlich immer nur eine „Stichprobe“, eben historische Messdaten, mit denen ich arbeite. Noch gar nicht erwähnt hatte ich, dass das auch noch Zeitreihen sind… . Ich bin aber mit der gefundenen Antwort erst einmal zufrieden. Werde mir nun mal die Herleitungen anschauen und mir gegebenenfalls später noch einmal die Anwendbarkeit in meinem Fall bestätigen lassen.

Vielen Dank also.
Andre