Hallo,
Ist diese Annahme so richtig?
ja. Die „triviale Rechnung“ ist genau so korrekt.
Gibt es in dieser Situation eine „cleverere“ Entscheidung im Sinne der Wahrscheinlichkeitsrechnung (so ähnlich wie beim Ziegenproblem)?
Ja. Statt mit irgendeiner blind geratenen Antwort weiterzuspielen oder das Spiel abzubrechen (diese beiden Optionen sind ja statistisch gleich gut bzw. gleich schlecht) wäre es – ganz analog zum Ziegenproblem – cleverer, zu versuchen, an hilfreiche Informationen bzgl. der Antworten zu kommen. Wenn man es beispielsweise schafft, dem Moderator irgendeinen „starken Tipp“ zu entlocken, ändert das die Gewichte in der Erwartungswertsumme derart, dass die Option „Weiterspielen“ für den Kandidaten statistisch (zumindest etwas) vorteilhafter wird als die Option „Abbrechen“.
Wenn man Deine Idee weiterspinnen wollte, könnte man vier mögliche Level definieren, um die Güte eines mit einer bestimmten Frage konfrontierten Kandidaten zu quantifizieren:
Level 0: Der Kandidat hat Null Ahnung, d. h. er muss unter allen vier Antworten raten;
Level 1: …hat wenig Ahnung: Er kann 1 Antwort ausschließen, muss aber bzgl. der übrigen 3 Antworten raten;
Level 2: …hat viel Ahnung: Er kann 2 Antworten ausschließen, muss aber bzgl. der übrigen 2 Antworten raten;
Level 3: …hat die totale Ahnung: Er kennt die richtige Antwort.
Jetzt kann man für sämtliche Fragen des Spiels (50 €, 100 €, 200 €, 300 €, 500 € = Sicherheitsstufe, 1T €, 2T €, 4T €, 8T €, 16T € = Sicherheitsstufe, 32T €, 64T €, 125T €, 500T €, 1000T €) die jeweiligen Erwartungswerte für jeden der vier Kandidatentypen ausrechnen („T“ steht für „Tausend“) :
50
E0 = (3*0 + 50)/4 = 12.50 (ja)
E1 = (2*0 + 50)/3 = 16 (ja)
E2 = (1*0 + 50)/2 = 25 (ja)
E3 = (0*0 + 50)/1 = 50 (ja)
100
E0 = (3*0 + 100)/4 = 25 nein
E1 = (2*0 + 100)/3 = 33 nein
E2 = (1*0 + 100)/2 = 50 egal
E3 = (0*0 + 100)/1 = 100 ja
200
E0 = (3*0 + 200)/4 = 50 nein
E1 = (2*0 + 200)/3 = 66 nein
E2 = (1*0 + 200)/2 = 100 egal
E3 = (0*0 + 200)/1 = 200 ja
300
E0 = (3*0 + 300)/4 = 75 nein
E1 = (2*0 + 300)/3 = 100 nein
E2 = (1*0 + 300)/2 = 150 nein
E3 = (0*0 + 300)/1 = 300 ja
500 (Sicherheitsstufe)
E0 = (3*0 + 500)/4 = 125 nein
E1 = (2*0 + 500)/3 = 166 nein
E2 = (1*0 + 500)/2 = 250 nein
E3 = (0*0 + 500)/1 = 500 ja
1T
E0 = (3*500 + 1T)/4 = 625 ja
E1 = (2*500 + 1T)/3 = 666 ja
E2 = (1*500 + 1T)/2 = 750 ja
E3 = (0*500 + 1T)/1 = 1000 ja
2T
E0 = (3*500 + 2T)/4 = 875 nein
E1 = (2*500 + 2T)/3 = 1000 egal
E2 = (1*500 + 2T)/2 = 1250 ja
E3 = (0*500 + 2T)/1 = 2000 ja
4T
E0 = (3*500 + 4T)/4 = 1375 nein
E1 = (2*500 + 4T)/3 = 1666 nein
E2 = (1*500 + 4T)/2 = 2250 ja
E3 = (0*500 + 4T)/1 = 4000 ja
8T
E0 = (3*500 + 8T)/4 = 2375 nein
E1 = (2*500 + 8T)/3 = 3000 nein
E2 = (1*500 + 8T)/2 = 4250 ja
E3 = (0*500 + 8T)/1 = 8000 ja
16T (Sicherheitsstufe)
E0 = (3*500 + 16T)/4 = 4375 nein
E1 = (2*500 + 16T)/3 = 5666 nein
E2 = (1*500 + 16T)/2 = 8250 ja
E3 = (0*500 + 16T)/1 = 16000 ja
32T
E0 = (3*16T + 32T)/4 = 20000 ja
E1 = (2*16T + 32T)/3 = 21333 ja
E2 = (1*16T + 32T)/2 = 24000 ja
E3 = (0*16T + 32T)/1 = 32000 ja
64T
E0 = (3*16T + 64T)/4 = 28000 nein
E1 = (2*16T + 64T)/3 = 32000 egal
E2 = (1*16T + 64T)/2 = 40000 ja
E3 = (0*16T + 64T)/1 = 64000 ja
125T
E0 = (3*16T + 125T)/4 = 43250 nein
E1 = (2*16T + 125T)/3 = 52333 nein
E2 = (1*16T + 125T)/2 = 70500 ja
E3 = (0*16T + 125T)/1 = 125000 ja
500T
E0 = (3*16T + 500T)/4 = 137000 ja
E1 = (2*16T + 500T)/3 = 177333 ja
E2 = (1*16T + 500T)/2 = 258000 ja
E3 = (0*16T + 500T)/1 = 500000 ja
1000T
E0 = (3*16T + 1000T)/4 = 262000 nein
E1 = (2*16T + 1000T)/3 = 344000 nein
E2 = (1*16T + 1000T)/2 = 508000 ja
E3 = (0*16T + 1000T)/1 = 1000000 ja
Das „ja/nein/egal“ in der letzten Spalte gibt jeweils an, ob es für einen Kandidaten dieses Typs statistisch klug ist, die entsprechende Frage zu spielen. Das ist genau dann der Fall, wenn sein E-Wert größer ist als die Gewinnstufe der vorangegangenen Frage.
Wie man sieht ist jeder Kandidat – gleichgültig, wieviel Ahnung er hat – gut beraten, die 500T-Frage zu spielen, weil er statistisch gesehen dabei nur gewinnen kann. Der Grund dafür ist die Nichtexistenz der 250T-Frage. Dass jeder Kandidat immer die auf die Sicherheitsstufen folgenden Fragen, also 1T und 32T, spielen sollte, versteht sich von selbst.
Das idealisierte Schema mit den vier Leveln 0 bis 3 ist natürlich auf reale Kandidaten nur begrenzt anwendbar. Diese befinden sich immer gewissermaßen auf „Zwischenleveln“, weil sie z. B. gefühlsmäßig zu irgendwelchen Antworten mehr tendieren als zu anderen. Das erhöht die Wahrscheinlichkeit, eine Gewinnstufe zu meistern, gegenüber blindem Raten zwischen nichtausgeschlossenen Antwortoptionen.
Gruß
Martin