Berechnung der Gewinnerwartung bei Wer wird Millionär

Hallo,

wir saßen grade vorm TV und hatten ne hitzige Familiendiskussion bei „Wer wird Millionär“ :wink: Folgendes Szenario: Der Kandidat hat 32.000€ und steht bei der 64.000€-Frage. Im Falle einer falschen Antwort fällt er (minimal) auf 16.000€. Zusammengefasst heißt das also

Risiko/Einsatz: 16.000€
möglicher Gewinn/Benefit: 32.000€

Gehen wir davon aus er hat keine Ahnung, kann aber eine Antwort mit Sicherheit ausschließen. Der Kandidat hat also eine Wahrscheinlichkeit von 1/3 richtig zu raten. Kann mir bitte jemand kurz, aber ausführlich genug um dem mathematisch zu folgen zeigen, wie die Gewinnerwartung des Kandidaten in Euro jetzt aussieht. Ich meine wie viel Euro wird es durchschnittlich weniger bzw. kommt dazu. Meiner eigenen (trivialen) Rechnung nach, kann er im beschriebenen Fall genau so viel gewinnen wie verlieren:

2 von 3 Fällen: 16.000€
1 von 3 Fällen: 64.000€

Im Schnitt ergibt das 32.000€, also exakt das was er im Moment „hat“.

Meine 1. Frage:

  • Ist diese Annahme so richtig?

Meine 2. Frage:

  • Gibt es in dieser Situation eine „cleverere“ Entscheidung im Sinne
    der Wahrscheinlichkeitsrechnung (so ähnlich wie beim Ziegenproblem)?

Danke im Voraus und freundliche Grüße

Hallo,

das kannst du vergessen, weil das ganze nicht nach der Wahrscheinlichkeitsrechnung, sondern
nach Drehbuch erfolgt.

Hallo!

Formal ist es zwar richtig, daß Kandidaten an der Stelle im Schnitt mit 32.000€ heraus gehen.

Aber was bringt dir das? Entweder, er fällt auf 16.000€ zurück und es ist aus, oder er kommt auf 64.000€, und kann nochmal. Es gibt aber keine Möglichkeit, tatsächlich 32.000€ zu erhalten.
Außerdem ist das ja nicht das Ende vom Lied. gewinnt der Kandidat durch Raten, ist der Gesamtgewinn ja durchaus höher, entweder, weil er bei den folgenden Fragen besser bescheid weiß, oder weil er wieder Glück hat.

Soll heißen: Deine Information ist das Papier nicht wert, auf dem sie steht.

Zur zweiten Frage: Der Punkt am Ziegenproblem ist doch, daß der Moderator weiß, hinter welchem Tor der Gewinn steckt, und dadurch, daß er eine Niete aus dem Spiel nimmt, ändert er die Informationslage für den Spieler. Das führt zu dem merkwürdigen Resultat, daß hier eine Umentscheidung tatsächlich die Chance auf den Gewinn erhöht.
In deinem Fall ist eine Antwort ausgeschlossen, es existieren genau drei mögliche Antworten, die auch alle (nach deiner Vorgabe) mit der gleichen Wahrscheinlichkeit richtig sind. Solange da keine weitere Information rein fließt, kann es auch keine Taktik geben, seine Gewinnchance zu erhöhen.

doch er kann aussteigen ohne die Frage zu beantworten, dann bekommt er diesen Betrag.

So habe ich noch nie über diese Serie nachgedacht ^^
Interessanter Ansatz

Dein Lösungsweg ist fast richtig.
Nehmen wir an, es geht nur um diese eine Frage, dann ist der Erwartungswert 32000€.
E = (2/3) * 16000 + (1/3) * 64000 = 32000

Nun würde es aber im Falle einer richtigen Antwort weitergehen, weshalb die Formel rein theoretisch weitergeführt werden muss bis zur allerletzten möglichen Frage. Dabei müsste man die Wahrscheinlichkeiten für zukünftige, unbekannte Fragen schätzen. Dies könnte man an Hand der Daten von alten Kandidaten machen, wäre aber relativ aufwändig (Bsp.: Die Wahrscheinlichkeit die Mio-Frage richtig zu beantworten ist viel geringer als die nächste Frage). In diesem Fall müsste man auch die Möglichkeit miteinbeziehen, dass ein Kandidat in bestimmten Situationen auch einfach aussteigen kann.

Zusammenfassend: Der Erwartungswert ist 32000 + x, wobei x all das beinhaltet, was vorher angesprochen wurde.

Aussteigen ginge ja schon. Der Knackpunkt ist - da du rein formal scheinbar zustimmst - ob es eine cleverere Entscheidung an dieser Stelle gibt.

Ich finde schon, dass es mit dem Ziegenproblem vergleichbar ist. Es wird zwar keine Informationslage für den Spieler verändert, aber das Ziegenproblem wäre komplexer wenn es sich nicht um Niete vs. Auto handeln würde, sondern um unterschiedlich wertige Autos hinter den übrig gebliebenen Toren. Der Punkt beim Ziegenproblem ist meiner Meinung nach, dass die ursprüngliche Chance von 1/3, das richtige Tor gewählt zu haben, sich nicht ändert.

Worauf ich beim WWM-Beispiel hinaus will: Der Erwartungswert entspricht exakt dem Betrag, den ich im Moment mit nach Hause nehmen könnte. Dem Erwartungswert nach, ist es gleich ob ich weiter spiele oder gehe. Betrachte ich jedoch die sich real ergebende Situation des Kandidaten, dann wird er nur in 1 von 3 Fällen gewinnen. Einfach gesagt: Gewinnerwartung hin oder her, seine Chancen sind nicht ausgeglichen. Aussteigen wäre dann die schlauere Variante.

aber ist es nicht so, dass er die 32000 schon sicher hat?

wenn wir von diesem fall ausgehen, dass er also auch einfach mit 32000 aussteigen kann, würde er in 2 von 3 fällen 16000 verlieren!

somit wäre der erwartungswert E = (2/3) * (-16000) + (1/3) * 64000 = 11666

korrektur: es muss natürlich heißen:
E = (2/3) * (-16000) + (1/3) * 64000 = 10666

andererseits müßte man vielleicht den ausstieg auch (als vierte option) in die rechnung einfließen lassen.

dann ist der erwartungswert, da beim ausstieg weder verloren noch gewonnen wird:
E = (1/4) * 0 - (1/2) * 16000 + (1/4) * 64000 = 8000

Hallo,

Ist diese Annahme so richtig?

ja. Die „triviale Rechnung“ ist genau so korrekt.

Gibt es in dieser Situation eine „cleverere“ Entscheidung im Sinne der Wahrscheinlichkeitsrechnung (so ähnlich wie beim Ziegenproblem)?

Ja. Statt mit irgendeiner blind geratenen Antwort weiterzuspielen oder das Spiel abzubrechen (diese beiden Optionen sind ja statistisch gleich gut bzw. gleich schlecht) wäre es – ganz analog zum Ziegenproblem – cleverer, zu versuchen, an hilfreiche Informationen bzgl. der Antworten zu kommen. Wenn man es beispielsweise schafft, dem Moderator irgendeinen „starken Tipp“ zu entlocken, ändert das die Gewichte in der Erwartungswertsumme derart, dass die Option „Weiterspielen“ für den Kandidaten statistisch (zumindest etwas) vorteilhafter wird als die Option „Abbrechen“.

Wenn man Deine Idee weiterspinnen wollte, könnte man vier mögliche Level definieren, um die Güte eines mit einer bestimmten Frage konfrontierten Kandidaten zu quantifizieren:

Level 0: Der Kandidat hat Null Ahnung, d. h. er muss unter allen vier Antworten raten;
Level 1: …hat wenig Ahnung: Er kann 1 Antwort ausschließen, muss aber bzgl. der übrigen 3 Antworten raten;
Level 2: …hat viel Ahnung: Er kann 2 Antworten ausschließen, muss aber bzgl. der übrigen 2 Antworten raten;
Level 3: …hat die totale Ahnung: Er kennt die richtige Antwort.

Jetzt kann man für sämtliche Fragen des Spiels (50 €, 100 €, 200 €, 300 €, 500 € = Sicherheitsstufe, 1T €, 2T €, 4T €, 8T €, 16T € = Sicherheitsstufe, 32T €, 64T €, 125T €, 500T €, 1000T €) die jeweiligen Erwartungswerte für jeden der vier Kandidatentypen ausrechnen („T“ steht für „Tausend“) :

50
E0 = (3*0 + 50)/4 = 12.50         (ja)
E1 = (2*0 + 50)/3 = 16            (ja)
E2 = (1*0 + 50)/2 = 25            (ja)
E3 = (0*0 + 50)/1 = 50            (ja)

100
E0 = (3*0 + 100)/4 = 25           nein
E1 = (2*0 + 100)/3 = 33           nein
E2 = (1*0 + 100)/2 = 50           egal
E3 = (0*0 + 100)/1 = 100          ja

200
E0 = (3*0 + 200)/4 = 50           nein
E1 = (2*0 + 200)/3 = 66           nein
E2 = (1*0 + 200)/2 = 100          egal
E3 = (0*0 + 200)/1 = 200          ja

300
E0 = (3*0 + 300)/4 = 75           nein
E1 = (2*0 + 300)/3 = 100          nein
E2 = (1*0 + 300)/2 = 150          nein
E3 = (0*0 + 300)/1 = 300          ja 
  
500 (Sicherheitsstufe)
E0 = (3*0 + 500)/4 = 125          nein
E1 = (2*0 + 500)/3 = 166          nein
E2 = (1*0 + 500)/2 = 250          nein
E3 = (0*0 + 500)/1 = 500          ja

1T
E0 = (3*500 + 1T)/4 = 625         ja
E1 = (2*500 + 1T)/3 = 666         ja
E2 = (1*500 + 1T)/2 = 750         ja
E3 = (0*500 + 1T)/1 = 1000        ja

2T
E0 = (3*500 + 2T)/4 = 875         nein
E1 = (2*500 + 2T)/3 = 1000        egal
E2 = (1*500 + 2T)/2 = 1250        ja
E3 = (0*500 + 2T)/1 = 2000        ja

4T
E0 = (3*500 + 4T)/4 = 1375        nein  
E1 = (2*500 + 4T)/3 = 1666        nein
E2 = (1*500 + 4T)/2 = 2250        ja  
E3 = (0*500 + 4T)/1 = 4000        ja

8T
E0 = (3*500 + 8T)/4 = 2375        nein
E1 = (2*500 + 8T)/3 = 3000        nein
E2 = (1*500 + 8T)/2 = 4250        ja
E3 = (0*500 + 8T)/1 = 8000        ja

16T (Sicherheitsstufe)
E0 = (3*500 + 16T)/4 = 4375       nein
E1 = (2*500 + 16T)/3 = 5666       nein
E2 = (1*500 + 16T)/2 = 8250       ja
E3 = (0*500 + 16T)/1 = 16000      ja

32T
E0 = (3*16T + 32T)/4 = 20000      ja
E1 = (2*16T + 32T)/3 = 21333      ja
E2 = (1*16T + 32T)/2 = 24000      ja
E3 = (0*16T + 32T)/1 = 32000      ja

64T
E0 = (3*16T + 64T)/4 = 28000      nein
E1 = (2*16T + 64T)/3 = 32000      egal
E2 = (1*16T + 64T)/2 = 40000      ja
E3 = (0*16T + 64T)/1 = 64000      ja

125T
E0 = (3*16T + 125T)/4 = 43250     nein
E1 = (2*16T + 125T)/3 = 52333     nein
E2 = (1*16T + 125T)/2 = 70500     ja
E3 = (0*16T + 125T)/1 = 125000    ja

500T
E0 = (3*16T + 500T)/4 = 137000    ja
E1 = (2*16T + 500T)/3 = 177333    ja
E2 = (1*16T + 500T)/2 = 258000    ja
E3 = (0*16T + 500T)/1 = 500000    ja

1000T
E0 = (3*16T + 1000T)/4 = 262000   nein
E1 = (2*16T + 1000T)/3 = 344000   nein
E2 = (1*16T + 1000T)/2 = 508000   ja
E3 = (0*16T + 1000T)/1 = 1000000  ja

Das „ja/nein/egal“ in der letzten Spalte gibt jeweils an, ob es für einen Kandidaten dieses Typs statistisch klug ist, die entsprechende Frage zu spielen. Das ist genau dann der Fall, wenn sein E-Wert größer ist als die Gewinnstufe der vorangegangenen Frage.

Wie man sieht ist jeder Kandidat – gleichgültig, wieviel Ahnung er hat – gut beraten, die 500T-Frage zu spielen, weil er statistisch gesehen dabei nur gewinnen kann. Der Grund dafür ist die Nichtexistenz der 250T-Frage. Dass jeder Kandidat immer die auf die Sicherheitsstufen folgenden Fragen, also 1T und 32T, spielen sollte, versteht sich von selbst.

Das idealisierte Schema mit den vier Leveln 0 bis 3 ist natürlich auf reale Kandidaten nur begrenzt anwendbar. Diese befinden sich immer gewissermaßen auf „Zwischenleveln“, weil sie z. B. gefühlsmäßig zu irgendwelchen Antworten mehr tendieren als zu anderen. Das erhöht die Wahrscheinlichkeit, eine Gewinnstufe zu meistern, gegenüber blindem Raten zwischen nichtausgeschlossenen Antwortoptionen.

Gruß
Martin