Fragen zur Wahrscheinlichkeitsrechnung

Hi.

Es geht um eine Frage zur Wahrscheinlichkeitsrechnung. Angenommen, in einer Kiste befinden sich 1.000 Kugeln, 500 davon sind rot und 500 weiß. Man greift (blind) hinein und nimmt eine zufällige Menge heraus, z.B. 36 Kugeln. Davon sind 27 rot und 9 weiß (Verteilung also 3:1). Wie groß ist die Wahrscheinlichkeit für genau diese Verteilung unter der Bedingung der übrigen genannten Daten?

Oder anders gefragt: Wie groß ist die Wahrscheinlichkeit, dass die Kugeln in der Kiste zu 50 Prozent rot und zu 50 Prozent weiß sind, wenn man zugrunde legt, dass die Gesamtmenge 1.000 ist und die Verteilung in einer Zufallsprobe von 36 Kugeln - wie oben gesagt - (rot : weiß =) 3:1 ist?

Wie sähen die angefragten Wahrscheinlichkeiten bei einer Gesamtmenge von 10.000 Kugeln (wiederum zur Hälfte rot und zur Hälfte weiß) aus?

(Der Kontext der Fragestellung ist paläoarchäologischer Natur)

Danke im voraus.

Chan

Und wie so oft bei solchen Experimenten:
MIt oder ohne Zurücklegen.

Erklärung des Kontexts

Und wie so oft bei solchen Experimenten:
MIt oder ohne Zurücklegen.

Keine Ahnung, wie du das meinst, aber es geht nicht um ein luftiges „Experiment“, sondern um eine konkrete paläoarchäologische Fragestellung, bei der ich die eigentlich gemeinten Phänomene (36 paläolithische Handabdrücke in Höhlen) durch „Kugeln“ ersetze und die Zuordnung „weiblich/männlich“ (bei den Abdrücken 3:1 verteilt) durch die Farben Rot und Weiß. Es gibt zwar Hunderte solcher Abdrücke, aber nur 36 sind so gut erhalten, dass ihr Gender festgestellt werden kann (Studie von Prof. Dean Snow von 2013). Da stellt sich die Frage, wie repräsentativ die von Snow ermittelte Verteilung von 27 weiblichen und 9 männlichen Abdrücken in Bezug auf die Gesamtmenge der Abdrücke ist. Von mir aus kann die Bezugsgröße auch 500 lauten, statt wie in meiner Frage 1.000 oder 10.000. Es geht allein um die Wahrscheinlichkeit einer zufälligen Abweichung von einer (hypothetischen) Gleichverteilung von weiblich/männlich. Die Kritiker von Snows Untersuchung können nämlich einwenden, dass sein Untersuchungsmaterial (36 Proben) zu gering ist, um statistisch repräsentativ zu sein.

lch hoffe, damit den Kontext hinreichend erklärt zu haben.

Chan

Hi,

üblicherweise entwickelt man solche Schätzer mit der Maximum-Likelihood-Methode. Die Wahrscheinlichkeit ist p für die erste Sorte und (1-p) für die zweite Sorte, die Wahrscheinlichkeit für das Ergebnis (m,n) ist C(m,n)*p^m*(1-p)^n, davon die Ableitung nach p bilden und Null setzen endet in

0=m*(1-p)-n*p=m-(m+n)*p,

also p=m/(m+n).

Du willst jetzt sicher die Hypothese p=0.5 gegen die gegebenen Daten testen, da ist dann wieder die Frage ob ein- oder zweiseitiger Hypothesentest und welches Quantil.

Gruß, Lutz

Zusatz: Die Wahrscheinlichkeit für die Zusammensetzung der Stichprobe ist von der Gesamtanzahl der Kugeln unabhängig, sofern eine faire Mischung vorausgesetzt werden kann. Die Wahrscheinlichkeit für das Ergebnis unter gegebenem Verhältnis p : (1-p) ist

binom(m+n, n) p^m*(1-p)^n

also bei p=0.5

(m+n)!/(m!*n!)*1/2^(m+n)

Gruß, Lutz

Bitte um Laienverständlichkeit
Hi Lutz.

binom(m+n, n) p^m*(1-p)^n
also bei p=0.5
(m+n)!/(m!*n!)*1/2^(m+n)

Besten Dank für die superfachliche Antwort, die aber gerade deswegen über meine laienhaften Kenntnisse deutlich hinausgeht. Könntest du es bitte laienverständlicher formulieren, z.B. als Prozentangabe auf die Frage, wie hoch die Zufalls-Wahrscheinlichkeit ist, dass eine Stichprobe von 36 Stück (aus einer fifty-fifty zusammengesetzten Gesamtmenge) eine 3:1-Verteilung aufweist?

Oder ganz anders gefragt: Wie hoch ist die Wahrscheinlichkeit (in %), dass die 3:1-Verteilung in einer 36er-Probe einer 3:1-Verteilung in der Gesamtmenge von 500 Stück genau entspricht bzw. dass man die 3:1-Verteilung (in der 36er-Probe) auf die Gesamtmenge (500) extrapolieren kann? (**Diese Variante wäre mir am liebsten).

Chan**