Informatiker

Liebe/-r Experte/-in,

eine einfache Frage zum Thema Statistik, über deren Antwort ich mich freue.

Ab wann ist eine Studienarbeit zum Thema „Häufigkeit von Linkshändigkeit in der deutschen Bevölkerung“ repräsentativ? Wieviel Personen müssen befragt werden?

Vielen Dank schon mal ,

Klaus :smile:

Die Frage gehört nicht zum Thema Informatik.

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Ab wann ist eine Studienarbeit zum Thema „Häufigkeit von
Linkshändigkeit in der deutschen Bevölkerung“ repräsentativ?
Wieviel Personen müssen befragt werden?

Hallo Klaus,
Deine Frage ist eher die an einen Mathematiker als an einen Informatiker. Daher kann ich Dir nur insofern antworten, wie es meinen Blick auf die Dinge erlaubt.

Wir bewegen uns zwischen zwei Extrempunkten:
1.) Wir befragen eine Personen, wonach es 100% Rechtshänder oder 100% Linkshänder geben würde. Der Fehler ist also in jedem Fall extrem hoch.
2.) Wir befragen alle Bundesbürger. Dann haben wir das absolut genaue Ergebnis!, was dann aber mit Statistik nichts mehr zu tun hat - ganz zu schweigen vom erforderlichen Aufwand…

Je weniger ich abweichend zu 2.) befrage, je mehr treten die Gesetze der Statistik in Kraft -aber- die Abweichung zur Realität vergrößert sich. Wo nun rein Mathematisch die zu empfehlende Menge liegt, kann ich nicht sagen. Fest steht für mich nur, dass es sich auch um eine Kosten-Nutzen Betrachtung handelt, wonach die Schnittmenge am Ende deutlich näher an 1.) als an 2.) liegen wird, was sicher auch der Forderung aus der Mathematik entsprechen dürfte. Bei der Auswahl der Befragten ist es in diesem Fall sicher nicht von Belang, welche Bevölkerungsgruppe angesprochen wird, da meines Wissens weder Links- noch Rechtshändigkeit einen Einfluss auf IQ oder Berufsgruppe haben dürfte. Auch der Altersbereich fällt als Kriterium heraus, da diese Dinge ein Leben lang unverändert bleiben. Eine signifikante Abhängigkeit könnte ich mir lediglich über größere Zeiträume (mehrere Generationen) vorstellen, was aber kurzfristig nicht möglich ist und eine Vielzahl von Befragungen bedeuten würde, um diesen Langzeittrend herauszuholen. Und ob es eine Geschlechtsabhingigkeit gibt, könnte bei der Auswahl der Befragten durchaus ermittelt werden (50/50).
Aber - wie gesagt - ab wann man hier von Signifikanz sprechen kann und wie viele Befragungen konkret erforderlich sind um der Fragestellung zu genügen muss ich leider offen lassen.
Anbieten könnte ich, meine Tochter zu befragen. Sie ist mitten in einem Mathestudium. Solltest Du also nicht weiter kommen, dann melde Dich einfach noch einmal und wir bekommen die Sache in den Griff.

Gruß von Ecki

Tolle Antwort, vielen Dank :smile:) Falls deine Tochter was zur Fragestellung weiß, bitte nomma melden …

LG,
Klaus

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Guten Tag.
Hm, das ist einge gute Frage, ab wann diese Umfrage repräsenteativ wäre =) Ich würde versuchen möglichst viele Leute zu erreichen, z.B.: durch eine Seite im Internet. Ab welcher Zahl von Befragungen dies nun repräsentativ wäre, kann ich leider auch nicht beantworten.

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

hier die Antwort meiner Tochter (Julia; Uni Greifswald):

Hi papa,
ich hab unseren Statistikguru gefragt, weil ich doch mich mit der Statistik nicht so angefreundet hab. Hier ist die Antwort:

Pauschal ist diese Frage nicht zu beantworten. Als Signifikanz nimmt man ja meistens einfach 5%. Um sagen zu können wieviel Leute befragt werden müssen um solch eine Signifikanz zu erreichen muss man sich aber noch festlegen wie genau der ermitelte Wert sein soll, also wie groß das Konfidenzintervall( soll das Ergebniss etwa nur ± 1% streuen müssen mehr leute befragt werden als wenn es auch ± 3% streuen kann).

Was du dann machst ist die Nullhypothese anzunehmen (zb. H0: 10% aller Deutschen sind Linkshänder => P(Linkshänder)=1/10 ). Dann definieren wir uns noch die variable #B die die Anzahl der Befragten bezeichnet (eben diese Größe wollen wir ausrechnen).

Da die Frage Linkshändigkeit ja mit ja oder nein beantwortet werden kann handelt es sich um eine Binomialverteilung. Der Mittelwert der Binomialverteilung war n*p (in unserem Fall also #B*1/10). Gehen wir mal davon auss unser Konfidenzintervall ist ± 1%, das heißt wir wollen dass mit 95%-Wahrscheinlichkeit das Ergebniss im Bereich [9% , 11%] liegt. Du kannst also die Ungleichung aufstellen P(9% 95%. In dieser Gleichung kommt ein #B vor. Also einfach nach #B umstellen und dann das kleinste nehmen für das die Ungleichung noch gilt (höheres #B erhöht dann natürlich die Signifikanz).

Das Problem ist das dass diese Ungleichung in der regel schwer zu berechnen ist (sehr große Fakultäten usw.). Deshlab approximieren wir noch mit der Normalverteilung. Für die Normalverteilung brauchen wir einen Mittelwert und eine Streuung. Die können wir aber einfach aus der Binomialverteilung übernehmen (wir approximieren ja, also müssen die beiden den gleichen Mittelwert und Streuung haben). Für Mittelwert war dies wie gesagt n*p (also #B*(1/10)) und für die Varianz war es n*p*q (also #B*(1/10)*(9/10)). Für die Streuung dann noch die Wurzel der Varianz nehmen).

Jetzt haben wir eine die Binomialverteilung approximierende Normalverteilung und kennen deren Streuung und Mittelwert. Jetzt gab es ja die schöne Merkformel dass der zweifache Streubereich 95% der Werte beinhaltet und dass wenden wir jetzt an. Wir überlegen wir uns also 2 Ungleichungen, und dass die erste gilt ist trivial.

  1. 0,09*#B Term zu bestimmen, die Rechnungen liefern beide dasselbe Ergebniss). Wir sagen also

#B*(1/10)-2*[(#B*(1/10)*(9/10)^(1/2)] = 0,09*#B

und stellen nach #B um und erhalten den gewünschten Wert.

Bevor du so etwas also ausrechnen kannst musst du erst mehre sachen bestimmen: H0, Sigifikanzniveau und Konfidenzintervall und die oben stehende Rechnung entsprechend modifizieren.