Servus Stefan,
Wie kommst du denn auf so einen Vergleich?
diesen Vergleich zu lesen hat mich in freundlicher Weise an Michael Leserer, einen didaktisch hervorragenden und fachlich nicht ganz unbeschlagenen Ökonometrieprof aus Göttingen erinnert.
„Gelernt“ haben wir bei ihm im prüfungs- und anwendungstechnisch relevanten Sinn nicht so sehr viel. Aber gelernt haben wir bei ihm immerhin, wie dürftig „empirische“ Mittel sind, enn man den Fehler begeht, an sie zu glauben. Seit ich Leserer gehört habe, schau ich bei der Lektüre empirischer Arbeiten so ziemlich zuerst auf die Beschreibung der angewandten Testmethoden. Mindestens 80% fallen dabei durch, nach dem Prinzip „Flensburger-Werbespot“: „Gut rechnen hat er ja gekonnt, aber genützt hat es ihm nichts.“
Gelehrt hat Leserer mit so banalen Exempeln mit Zen-Prägung wie:
„Ein Mann rennt morgens um halbacht zum Bahnhof. Warum rennt er?“ - (jeder weiß warum)
Dieses ist eine Frage, die mit den Mitteln der Statistik & Ökonometrie stets nur falsch beantwortet werden kann, weil der Grund dafür, dass er rennt, in der Zukunft liegt.
Ich will hier keine Fachdiskussion vom Zaun brechen, in der ich hoffnungslos unterläge. Aber ich möchte gern den Vergleich „repräsentative“ Daten - „vollkommene“ Schönheit verteidigen, etwa in dem Sinn: Wer eine mögliche Analogie a priori ausschließt, handelt analog zu einem, der vor einer Auswertung erstmal alle „Ausreißer“ wegstreicht. Er will die Möglichkeit von Überraschungen vermeiden, obwohl es das Wesen der Stochastik ist, mit Überraschungen zu leben.
Das Analog, schlage ich als Arbeitstitel vor, ist, dass es sich bei beiden Begriffen um objektiv unerreichbare Idealvorstellungen handelt. Die Aussage „Diese Erhebungsdaten sind repräsentativ. Punktum.“ ist genauso gefährlich wie die „Diese Frau ist die Schönste. So isses.“ Gefährlich, weil man in beiden Fällen vergisst, dass man ebent nur im Sinn von „best“ (relativ) und mehr oder weniger „unbiased“ (selbst dieses relativ) arbeitet. Das L zum BLU lass ich weg, weil dieses bereits ein Eingeständnis der Unvollkommenheit einer Schätzung ist. Das L hat seine Existenzberechtigung nur aus technischen Motiven: Es gibt das L bloß, weil man sonst nicht mit Vektoren rechnen könnte und die ganze Sach unquantifizierbar bliebe.
Das bedeutet keinesfalls, dass die halt maximal mögliche Annäherung an so ein Ideal wertlos wäre. Aber es bedeutet, dass man sich daran erinnern muss, dass es sich um eine Annährerung handelt.
Hierzu noch ein Leserer im Original (aus einer Anfängervorlesung):
„Meine Damen und Herren, ich bitte zu bedenken, dass im Rahmen dieses Modells unser ganzes Leben in irgendwelchen Urnen verpackt ist, und uns bleibt nichts übrig, als blind zu ziehen“
In diesem Sinne
MM