Hallo,
http://www.aerzteblatt.de/v4/archiv/pdf.asp?id=67473
Kurzform: I.a. beschränkt man den Fehler eine stat. Hypothese
fälschlich abzulehnen mit 5% (alpha). Führt man mehrere Tests
zu diesem Niveau durch, macht man aber einen Gesamtfehler von
1-(1-alpha)^(anzahl der Tests), was bedeutet, dass bei
mehreren Tests, das Gesamtrisiko mindestens eine Hypothese
fälschlich abzulehnen größer als 5% ist.
Man „irrt“ also öfter.
Das ist interessant und verständlich. So wie ich das jetzt kapiert habe, tritt dieser Effekt dann auf, wenn man an der selben Gruppe Versuchspersonen unterschiedliche Hypothesen testet. Jetzt frage ich mich, wieviele gesonderte Hypothesen in besagtem Paper jetzt betrachtet werden müssen.
Zum Einen natürlich: „Die Wahrscheinlichkeit, richtig zu raten, liegt über 25%.“
Dann finde ich noch „Die Fehlerquote liegt bei unbekannten Menschen höher als bei bekannten“
Ich finde es auch nichtssagend bis bedenklich, hinter jede einzelne Datenzeile son p-Wert zu setzen - die dazugehörende Hypothese „Versuchsperson i erreicht mit jedem Anrufer j über 25 % richte Guesses“ wurde aber auch nirgendwo aufgestellt.
Wenn wir nur die gesammelten Daten mit der einzigen Hypothese „Die Wahrscheinlichkeit, richtig zu raten, liegt über 25%.“ untersuchen, wären dann noch Fehler durch multiplicity zu befürchten?
Wie nutzt ihm diese Information, wenn für den
zweiten Anruf neu gewürfelt wird?wenn zwei mal hintereinander derselbe angrufen hat, wird der
angerufene diesen (wegen der Randomisierung) bei nächsten Mal
eher ausschließen.
und andersherum wird bei fehlen oder Unterbesetzung von
Anrufern der angerufene dieser bevorzugen um „den Schnitt“ zu
erhalten.
Würde der angerufene die Info nicht bekommen, ob er richtig
lag oder nicht, wäre die W’keit tatsächlich immer 25%.
Moment, da wundert sich mein nicht statistikbewandertes Mathematikerhirn jetzt doch.
Wenn es ist, wie du sagst, denkt der Angerufene also „Anrufer A war grade, der kommt nicht nochmal“, und rät einen anderen.
Allerdings macht er damit doch einen Fehler - die Wahrscheinlichkeit, dass A nochmal anruft, ist wieder genau 25%, unabhängig davon was vorher war.
Andersherum betrachtet: Nehmen wir an, der Angerufene rät zuerst (und zwar nicht A, weil der grade dran war), DANN wird gewürfelt. Bei einem Nichtvorhandensein von Telepathie sollte so das Selbe herauskommen, wie wenn man erst würfelt und er dann rät. Dass jedoch der Würfel die Person anzeigt, die der Angerufene geraten hat, hat wieder eine Wahrscheinlichkeit von 25%. Die Erfolgswahrscheinlichkeit steigt dadurch nicht.
Liebe Grüße,
Giogio