Kleine Stochastik Frage

Hallo Martin

Die Beschreibung der Methode Deiner Simulation hat mir aber klargemacht, dass wir unter
„Ziehung“ glücklicherweise dasselbe verstehen.

Gibt es jetzt eigentlich noch was zu diskutieren?

Ja. Was ist Unredlichkeit ?

Es war von Anfang an klar (mit deiner Intelligenz auch für dich) was wir unter Ziehung beide
verstehen und anhand der Fragestellung des UP, sowie unserer Aussagen und Zahlen
verstehen müssen

Die Art (und Gründe) deiner Gegenhaltung und (scheinheiligen) Hinterfragung solltest du
mal überdenken. Mir (und auch dir) kannst du nichts vormachen.
Mißverständnisse kann man auch konstruieren !
Wir hätten uns die ganze lange Thread-Verlängerung sparen können.

Gruß Viktor

Viktor, komm bitte runter. Meine Güte, man wird doch wohl noch eine Frage an Dich richten dürfen, ohne dass Du dahinter gleich eine böse Absicht vermutest. Ich war mir schlicht einen Moment unsicher, ob Du unter „Ziehung“ das Entnehmen und Zurücklegen zweier Kugeln aus der Urne verstehst, oder stattdessen möglicherweise die Gesamtheit aller 281 Ziehungen (oder wieviele halt nötig sind), also sozusagen das komplette Spiel. Das wollte ich sicherheitshalber geklärt wissen – ist das ein Verbrechen? Ein einziger kurzer Satz als Antwort hätte völlig genügt. Jemandem wegen einer Frage Unredlichkeit, Scheinheiligkeit und die absichtliche Konstruktion eines Missverständnisses zu unterstellen, finde ich nicht angebracht.

Ein Punkt von Dir ist noch offen: Du wolltest wissen, wie stark sich der Unterschied zwischen den Ziehungsmodi (a) „beide Kugeln paarweise-gleichzeitig gezogen und zurückgelegt“ und (b) „beide Kugeln einzeln nacheinander gezogen und zurückgelegt“ im Ergebnis bemerkbar macht. Logischerweise wird (a) im Mittel etwas weniger Ziehungen benötigen als (b), aber man kann sogar aus einer einfachen Überlegung heraus die Differenz voraussagen: Es muss die Hälfte von 281/107 sein, also etwa 1.3. Ich habe mittlerweile selbst ein Simulationsprogramm geschrieben, das unter anderem diesen Wert bestätigt.

Gruß
Martin

wieder, allerdings mit „+o1“ angehängt.
Was bedeuted das?

Es könnte für „Ordnung“ (engl. „order“) stehen, vgl. mit http://de.wikipedia.org/wiki/Approximation#Ordnung_d…

mfg M.L.

Hallo Martin,

Das wollte ich sicherheitshalber geklärt wissen – ist das ein Verbrechen? Ein einziger :kurzer Satz als Antwort hätte völlig genügt.

Dieser „kurze Satz“ erfolgte schon in meiner Einlassung vom 11.10.2014 18:45 an dich .

Ein Punkt von Dir ist noch offen: Du wolltest wissen, wie
stark sich der Unterschied zwischen den Ziehungsmodi (a)
„beide Kugeln paarweise-gleichzeitig gezogen und zurückgelegt“
und (b) „beide Kugeln einzeln nacheinander gezogen und
zurückgelegt“ im Ergebnis bemerkbar macht. Logischerweise wird
(a) im Mittel etwas weniger Ziehungen benötigen als (b),

Ja.

aber man kann sogar aus einer einfachen Überlegung heraus die
Differenz voraussagen: Es muss die Hälfte von 281/107 sein,also etwa 1.3.

Nein, diese Überlegung erschließt sich mir nicht.Das „Mittel“ wurde ja aus einer Menge von
nicht kontinuierlich gestaffelten Werten (Abschnittsgrößen) ermittelt.

Ich habe mittlerweile selbst ein Simulationsprogramm geschrieben, das unter anderem :diesen Wert bestätigt.

Wie genau muß der Wert sein, daß du ihn als „bestätigt“ bezeichnest ?
Meine Simulation bringt etwa 1,1 Differenz (1 Milliarde Zufallszahlen)
Nun könnte man sagen - was soll’s, ungefähr, mehr gibt eine Simulation (mit vielleicht
schlechtem Zufallgenerator) nicht her.
Aber was ist mit 6 aus 49 statt 2 aus 107 ?

Man kann bei dem anstehenden Problem leicht Irrtümer einbauen beim Programmieren der
Simulation.
So darf z.Bsp. ein Abschnitt (statistisch) noch nicht abgeschlossen sein der zwar alle
vorgegebenen Zahlen enthält, aber diese bei der letzten Ziehung schon mit der ersten
Zahl von mehreren erfüllt.
Wenn bei einer Ziehung der Zufallsgenerator die zweite (oder eine weitere) Zahl gleich der
ersten bringt dürfen die Auflistung der Anzahl der Mehrfach Zufallszahlen keinen Einfluß auf
irgendeinen Zähler der statistischen Erfassung haben.
Immerhin ist die Trefferquote für jede Zahl 1/n^1+1/n^2+1/n^3…wenn n die Anzahl der
Zahlen (hier 107) ist.
Es gibt noch andere Kleinigkeiten - diese sind hier die wichtigsten, wie ich das sehe.
Meine „Programm-Architektur“ werde ich jedenfalls nochmals überprüfen.

Gruß Viktor

Hallo Viktor,

Nein, diese Überlegung erschließt sich mir nicht.

im Ziehungsmodus (b) sind Zwillingsziehungen möglich, d. h. es kann der Fall eintreten, dass eine Ziehung zweimal dieselbe Kugel zutage fördert. Bei einer Kugelanzahl von 107 und einer mittleren Spieldauer von 281 Ziehungen passiert das pro Spiel statistisch 281/107 mal. Da eine Zwillingsziehung nun für das Spiel genau halb so „wertvoll“ ist wie eine Ziehung zweier verschiedener Kugeln (was im Modus (a) immer garantiert ist), muss man die 281/107 noch mit dem Faktor 1/2 versehen.

Wie genau muß der Wert sein, daß du ihn als „bestätigt“ bezeichnest ?

Die Standardabweichung muss hinreichend klein sein. Ich habe für jeden der beiden Ziehungsmodi 25 Serien mit einer Länge von je 20 Millionen Spielen durchgeführt. Aus den 25 Serienmittelwerten habe ich anschließend einen Total-Mittelwert und dessen Standardabweichung berechnet. Letztere liegt bei etwa 0.005, was mich zu der getroffenen Aussage berechtigt (falls Dich die konkreten Ergebnisse interessieren: 281.39 ± 0.0053 bzw. 280.07 ± 0.0044. Kannst ja versuchen, das zu reproduzieren. Eine außerdem noch durchgeführte Simulation mit 1-Kugel-Ziehungen lieferte 562.28 ± 0.01. Die Formel aus dem Wikipedia-Artikel sagt dafür 562.25476… voraus.).

Meine Simulation bringt etwa 1,1 Differenz (1 Milliarde Zufallszahlen)

Eine Milliarde erscheint mir zuviel, um die 1.1 noch als 1.3 durchgehen zu lassen. Vielleicht findest Du ja noch die Ursache.

Aber was ist mit 6 aus 49 statt 2 aus 107 ?

Selbstverständlich wäre auch 6 aus 49 auf ähnliche Weise simulierbar.

Man kann bei dem anstehenden Problem leicht Irrtümer einbauen beim Programmieren der Simulation.

Oh ja, das ist bestimmt wahr.

So darf z.Bsp. ein Abschnitt (statistisch) noch nicht abgeschlossen sein der zwar alle
vorgegebenen Zahlen enthält, aber diese bei der letzten Ziehung schon mit der ersten
Zahl von mehreren erfüllt.

Da ich die Arbeitsweise Deiner Simulation nicht kenne (es gibt da durchaus mehrere Ansätze) kann ich dazu nichts sagen. Hört sich aber spannend an.

Meine „Programm-Architektur“ werde ich jedenfalls nochmals überprüfen.

OK.

Gruß
Martin

Hallo Martin

Nein, diese Überlegung erschließt sich mir nicht.

im Ziehungsmodus (b) sind Zwillingsziehungen möglich,

oder mehr.
es kann sein (ist so) daß bei der vorliegenden Situation deine Berechnung der Abweichung
sehr nahe kommt, aber wäre diese Berechnung prinzipiell korrekt ?

Ich habe mein Programm verfeinert und erweitert so daß es alle Variablen und Modi durch
die Eingabe am Monitor erfassen kann und verarbeitet.
So ist es leicht z.Bsp. 3 aus 4, 6 aus 49 oder 140 aus 150 zu berechnen mit den Modis a)
oder b) - nach deiner Bezeichung - der Anzahl der Ziehungen mit mehren (auch variablen)
Durchgängen. Dies nur deshalb:
So sind z.Bsp. bei 6 aus 49 der Mittelwert bei a) 35,1 bei b) 37,0
Könnte man diese Differenz von 1,9 auch aus aus den Zahlen 49 37,1 und 6 errechnen
wenn auch nur angenähert ?
(bei 3 aus 4 sind z,Bsp. die Mittelwerte 2,333 und 3,125)

(falls Dich die konkreten Ergebnisse interessieren: 281.39 ± 0.0053 bzw. 280.07 ± 0.0044)

Ja, diese Werte habe ich auch sehr genau getroffen so daß mein Programmlauf dann
auch korrekt ist.

Eine außerdem noch durchgeführte Simulation mit 1-Kugel-Ziehungen lieferte 562.28

Ja, habe ich auch etwa und hatte dies zuerst mit meinem provisorischen Programm um deine
Formel zu überprüfen. Bei der Halbierung dieses Wertes für 2 Kugeln pro Ziehung, wie du es ja angegeben hattest, kommt halt eine Differenz zu a) von ca 1,1 heraus.
Diesen Wert hatte ich noch im Kopf ohne ihn für die reale Situation zu prüfen.

Meine Simulation bringt etwa 1,1 Differenz (1 Milliarde Zufallszahlen)

So darf z.Bsp. ein Abschnitt (statistisch) noch nicht abgeschlossen sein der zwar alle
vorgegebenen Zahlen enthält, aber diese bei der letzten Ziehung schon mit der ersten
Zahl von mehreren erfüllt.

Da ich die Arbeitsweise Deiner Simulation nicht kenne (es gibt
da durchaus mehrere Ansätze) kann ich dazu nichts sagen. Hört
sich aber spannend an.

Da du ja als Laufzahl (soweit ich es aus deinen Bemerkungen entnehme) „Spiele“ gesetzt
hast - jeder Abschnitt ein Spiel ? - dürfte vorstehendes eigentlich nicht passieren, wenn du
jede Ziehung abschließt.
Ich habe als Laufzahl „Ziehungen“ genommen.
Wichtig ist natürlich, daß man nicht nur zweifach sondern auch mehrfach Treffer einer
Zahl beim Modi a) je Ziehung eliminiert, vor allem wenn man eben z.Bsp. 6 aus 49 hat.

Gruß Viktor

PS.
Ich hatte schon mal Zweifel, ob man die Mehrfachtreffer einer Zahl bei einer Ziehung
statistisch eliminieren darf da man ja dann in die Menge der Zufallszahlen eingreift.
Da dies aber jede Zahl der definierten Auswahlmenge betrifft gleicht sich dies ja wieder aus.

Hallo Viktor,

es kann sein (ist so) daß bei der vorliegenden Situation deine Berechnung der Abweichung
sehr nahe kommt, aber wäre diese Berechnung prinzipiell korrekt ?

wir hatten es von Anfang an sowieso nur mit Näherungsformeln zu tun, und die Korrektur, die meine Überlegung liefert, wird wahrscheinlich in der fünften Nachkommastelle auch von irgendwelchen mir unbekannten statistischen Nebeneffekten überlagert (oder auch nicht – keine Ahnung). Grundsätzlich finde ich aber meine Überlegung für 2-Kugel-Ziehungen richtig. Natürlich ist sie auch nur auf 2-Kugel-Ziehungen begrenzt.

Könnte man diese Differenz von 1,9 auch aus aus den Zahlen 49 37,1 und 6 errechnen
wenn auch nur angenähert ?

Ja, auch das geht. Ich darf Dich hier an die Wikipedia verweisen:

http://de.wikipedia.org/wiki/Sammelbilderproblem

Im Abschnitt „Päckchen“ wirst Du fündig. Soweit ich es gesehen habe, existiert für den Dich interessierenden Fall (Ziehung von k Kugeln ohne Zurücklegen, was 6-aus-49-Lotto einschließt) allerdings wohl keine geschlossene Formel mehr, sondern nur eine in Summendarstellung. Du kannst auch eine Google-Suche starten mit coupon’s collector problem oder Sammelbilderproblem. Es gibt sehr viel zu lesen darüber.

Noch weiter vertiefen möchte ich mich in dieses Problem ehrlich gesagt auch eher nicht mehr, aber mit den Abhandlungen, die Du im Netz dazu findest, wirst Du sicher noch die eine oder andere Deiner Fragen erhellen können.

Gruß und ein schönes WE
Martin

Hallo,

Kurze Nachfrage auf Wikipedia findet man Martins Formel wieder

es ist eher umgekehrt: Die Formel aus der Wikipedia findet man in meinem Artikel wieder… :wink:

allerdings mit „+o1“ angehängt. Was bedeuted das?

Die besagte Formel n ln(n) + γn + 1/2 ist eine Näherung und das „+ o(1)“ gibt grob gesagt Auskunft über die Qualität der Näherung. Konkret bedeutet o(1), dass der Fehler zwischen dem von der Formel gelieferten Wert und dem exakten Wert mit steigendem n nicht schneller als eine Konstante anwächst. Du kannst Dir das o(1) einfach als Abkürzung für irgendeinen komplizierten Term denken, der viel kleiner ist als 1. Eine gleichwertige Ausdrucksweise dafür ist „asymptotisch gegenüber 1 vernachlässigbar“.

Die mathematisch wasserdichte Erklärung findest Du hier:
http://de.wikipedia.org/wiki/Landau-Symbole

Gruß
Martin