hier die Antwort meiner Tochter (Julia; Uni Greifswald):
Hi papa,
ich hab unseren Statistikguru gefragt, weil ich doch mich mit der Statistik nicht so angefreundet hab. Hier ist die Antwort:
Pauschal ist diese Frage nicht zu beantworten. Als Signifikanz nimmt man ja meistens einfach 5%. Um sagen zu können wieviel Leute befragt werden müssen um solch eine Signifikanz zu erreichen muss man sich aber noch festlegen wie genau der ermitelte Wert sein soll, also wie groß das Konfidenzintervall( soll das Ergebniss etwa nur ± 1% streuen müssen mehr leute befragt werden als wenn es auch ± 3% streuen kann).
Was du dann machst ist die Nullhypothese anzunehmen (zb. H0: 10% aller Deutschen sind Linkshänder => P(Linkshänder)=1/10 ). Dann definieren wir uns noch die variable #B die die Anzahl der Befragten bezeichnet (eben diese Größe wollen wir ausrechnen).
Da die Frage Linkshändigkeit ja mit ja oder nein beantwortet werden kann handelt es sich um eine Binomialverteilung. Der Mittelwert der Binomialverteilung war n*p (in unserem Fall also #B*1/10). Gehen wir mal davon auss unser Konfidenzintervall ist ± 1%, das heißt wir wollen dass mit 95%-Wahrscheinlichkeit das Ergebniss im Bereich [9% , 11%] liegt. Du kannst also die Ungleichung aufstellen P(9% 95%. In dieser Gleichung kommt ein #B vor. Also einfach nach #B umstellen und dann das kleinste nehmen für das die Ungleichung noch gilt (höheres #B erhöht dann natürlich die Signifikanz).
Das Problem ist das dass diese Ungleichung in der regel schwer zu berechnen ist (sehr große Fakultäten usw.). Deshlab approximieren wir noch mit der Normalverteilung. Für die Normalverteilung brauchen wir einen Mittelwert und eine Streuung. Die können wir aber einfach aus der Binomialverteilung übernehmen (wir approximieren ja, also müssen die beiden den gleichen Mittelwert und Streuung haben). Für Mittelwert war dies wie gesagt n*p (also #B*(1/10)) und für die Varianz war es n*p*q (also #B*(1/10)*(9/10)). Für die Streuung dann noch die Wurzel der Varianz nehmen).
Jetzt haben wir eine die Binomialverteilung approximierende Normalverteilung und kennen deren Streuung und Mittelwert. Jetzt gab es ja die schöne Merkformel dass der zweifache Streubereich 95% der Werte beinhaltet und dass wenden wir jetzt an. Wir überlegen wir uns also 2 Ungleichungen, und dass die erste gilt ist trivial.
- 0,09*#B Term zu bestimmen, die Rechnungen liefern beide dasselbe Ergebniss). Wir sagen also
#B*(1/10)-2*[(#B*(1/10)*(9/10)^(1/2)] = 0,09*#B
und stellen nach #B um und erhalten den gewünschten Wert.
Bevor du so etwas also ausrechnen kannst musst du erst mehre sachen bestimmen: H0, Sigifikanzniveau und Konfidenzintervall und die oben stehende Rechnung entsprechend modifizieren.