Binomialverteilung

Hallo zusammen,

in einer Urne befinden sich unendlich viele Kugeln, von denen 60 % weiß sind. Die Wahrscheinlichkeit, bei 10 Zügen höchstens 5 weiße Kugeln zu ziehen, ist mit der kumulierten Binomialverteilung berechnet 36,6 %.
Die W. von 100 Kugeln aus der Urne höchstens 50 weiße zu ziehen, ist nur 2,7 %.
Wie kommt es zu diesem Unterschied? Warum ist es nicht egal, ob höchstens 5 von 10 oder höchstens 50 von 100 weiß sind? Die Verteilung mit dem hohen N ist symmetrischer um den Erwartungswert, aber darum geht es mir nicht. Ich würde es gerne inhaltlich/anschaulich verstehen.

Viele Grüße
Tychi

Hallo,
erstmal was allgemeines: In der Mathematik darf man nicht erwarten, daß alles anschaulich zu verstehen ist.

Nun zu Deinem Problem: Ich glaube herauszuhören, daß Du lieber 10-mal das 5-aus-10 Experiment machen möchtest (mit jeweils 36.6%) und stellst Dir vor, daß diese Experimente unabhängig sind, und damit die Gesamtwahrscheinlichkeit eher in der Größenordnung der Einzelwahrscheinlichkeiten liegen muß, richtig?

Das ist auch richtig als obere Schranke, die Gesamtwahrscheinlichkeit für 50-aus-100 wird nie größer werden. Nun zur unteren Schranke: Stell Dir das Gegenteil vor, die Experimente bedingen einander, also berechne die Wahrscheinlichkeit, daß beim zweiten Experiment ebenso nur höchstens 5-aus-10 gezogen werden, gegeben daß im ersten Experiment höchstens 5-aus-10 gezogen wurden. Damit kämst Du bei 10 Experimenten auf ca. 0.0043% Gesamtwahrscheinlichkeit.

Nun ja, die Wahrheit liegt aber in der Mitte und ist viel viel höher als die bedingte Wahrscheinlichkeit (Produkt der Erwartungen). Warum? Weil ich ja im ersten Experiment auch die Ziehung von 6 weißen Kugeln zulassen muß, wenn ich im zweiten Experiment nur 4 ziehe, ich habe also einen gewissen Spielraum, und dieser Spielraum „zieht“ die Wahrscheinlichkeit „nach oben“.

Genau, das Verstaendnis muss schon bei der Anzahl von unendlich vielen Kugeln aufhoeren, die in einer entsprechend unendlich grossen Urne liegen, in die man unendlich tief greifen muesste, um nicht nur oberflaechlich liegende Kugeln herauszunehmen. Typisch Mathematiker.
Gruss Helmut

Hallo,

die Ziehung von 100 Kugeln kann man als 10 Ziehungen von 10 Kugeln auffassen, einverstanden. Dass die W. für mind. 50 Kugeln größer sein muss als 0,0042 % sehe ich auch ein. Wie man dann aber auf 2,7 % kommt oder auch nur auf die Größenordnung, ist nicht mehr einzusehen. Mit dem Argument, dass noch vieles andere passieren könnte als in jeder Ziehung bis zu 5 weiße Kugeln zu ziehen, lässt es sich auf beinahe jede andere W. kommen, die größer als 0,0042 % ist.
Meine gegenwärtige Idee ist folgende: Die Standardabweichung wächst mit Wurzel aus n, aber der Erwartungswert mit n. Die W. eines Ereignisses liegt mit 68 % W. innerhalb von mü plusminus sigma. Bei n = 100 liegt 50 außerhalb dieses Intervalls, bei n = 10 liegt 5 aber innerhalb. Daran sieht man, dass P(X<51) < P(X<6).
Jetzt müsste man nur noch verstehen, warum sigma langsamer wächst als mü, die Verteilung sich also mit größer werdendem n relativ gesehen immer mehr um mü zusammenschnürt.

Schöne Grüße
Tychi

Hm, also erstmal gute Überlegungen. Du hast jetzt auch nochmal gezeigt, daß die obere Schranke gilt. Zusammen mit meiner unteren Schranke kennen wir jetzt immer nur noch den gleichen Bereich (0.0043% bis 36.7%). Ich würde auch sagen, daß man die obere Schranke verbessern muß.

Leider kann man hier nicht so gut Mathematik schreiben wie in anderen Foren. Meine Idee war es, die Wahrscheinlichkeit als Polynom in p zu schreiben, mit Koeffizienten 0.4^(N - i) * (N über N-i) und dann mittel Analysis die Stelle 0.6 zu untersuchen. Macht man das, dann sieht man, daß nur die höchsten Grade eine Rolle spielen. Warum? Vermutlich wegen der Log-Konkavität der Binomialkoeffizienten (an den höchsten Graden stehen gerade N über N/2 und N über N/2+/-1). Die Stelle 0.6 ist also extrem stark gekrümmt, und die Krümmung wächst exponentiell mit wachsendem N. Die Wahrscheinlichkeit geht gleichsam exponentiell gegen 0 mit wachsendem N.

Auch mit dieser Betrachtung bekommst Du nur ein Gefühl für das Verhalten, aber keine konkreten Zahlen, allerdings kann man mit dem (exponentiellen) Wachstumsverhalten schon folgern, daß bei Verzehnfachung von N (und k) die Wahrscheinlichkeit deutlich kleiner als bei N sein muß. Ich weiß nicht, ob das für Dich noch als anschaulich gilt, aber die Binomialverteilung lädt geradezu ein, analytische Betrachtungen durchzuführen.

Oh mann, ich meine natürlich quadratisches Wachstumsverhalten bei linear wachsendem N. Ist ja klar, daß bei exponentiell wachsendem N dann auch die Krümmung exponentiell wächst.

Hallo,

ich glaube, ich habe das Problem gelöst.
wir haben doch über die Frage diskutiert, warum P(X ≤ 5) > P(X ≤ 50) wenn p = 0,6 und n = 10 bzw. 100. Am Ende war ich da stehen geblieben, dass sich die Verteilung bei größer werdendem n immer mehr um den Erwartungswert zusammenzieht, relativ zu n gesehen. Innerhalb von mü ± sigma liegen rund 68 % der Verteilungsfläche. Sigma wächst mit Wurzel(n), während der Erwartungswert mit n wächst. Im Beispiel liegt 5 innerhalb von sigma, 50 liegt aber außerhalb, weshalb alle Werte bis 50 ebenfalls außerhalb liegen und nicht viel von der Fläche abbekommen.

Damit verschob sich die Frage dahin, warum die Verteilung sich mit größer werdendem n um den EW zusammenschnürt. Das ist mir nun nach längerem Grübeln klar geworden.

Betrachten wir den Münzwurf. Wenn ich die Münze nur zweimal werfe und X die Anzahl von Kopf ist, dann ist E(X) = 1, aber die Wahrscheinlichkeiten für X = 0 und X = 2 sind durchaus beträchtlich (jeweils 25 %). Dabei liegt man 100 % unter oder über dem EW.
Werfen wir die Münze aber 100 mal, dann sind X = 0 und X = 100 so gut wie ausgeschlossen. Mit 98,2 % Wahrscheinlichkeit liegt man zwischen X = 40 und X = 60. Das liegt daran, dass es viel mehr Wege im Baumdiagramm oder auf dem Galton-Brett gibt, die in die Nähe von 50 führen. Es gibt rund 7 mal mehr Möglichkeiten zur 50 zu gelangen als es Möglichkeiten gibt, zur 40 zu gelangen. Bei 10 Würfen ist das Verhältnis 10C5 : 10C4 nur 1,2, was bedeutet, dass der Erwartungswert nicht viel besser dran ist als die relativ genauso weit entfernte Alternative.

Damit ist für mich nun einleuchtend, warum mit zunehmendem n der Erwartungswert immer stärker bevorzugt wird (an keiner Stelle wurden dazu relative Häufigkeiten bemüht, allein die Anzahl von Möglichkeiten spielen eine Rolle). Und daraus folgt, dass ein proportional gleich weit vom EW entferntes Ereignis mit zunehmendem n immer unwahrscheinlicher wird.

Entsprechend überrascht es auch nicht, dass in unserem Kugelbeispiel vom Anfang das Gegenteil gilt, wenn p = 0,4, nämlich: P(X ≤ 5) < P(X ≤ 50).

Schönen Gruß und danke für die Diskussion,
Tychhi