Hi,
Das hört sich aber doch mal sehr gut an! Wie würde ich diese
Fragestellung denn angehen („wie groß müsste
die Stichprobe sein, damit das 95% Konfi für die proportion
von Merkmal X eine maximale Breite von z hat“)?
Das Merkmal X kann k Ausprägungen haben (geschlecht hätte 2, Kinder deutlich mehr), die müsste man erstmal festlegen und auch, ob man mehrere Merkmale untersuchen will.
Dann kann man ganz simpel messen (oder zuerst einmal annehmen), dass n1 Leute der Stichprobe der größe n in X_1 fallen, n_2 in X_2 und so weiter und n_k in X_k, wobei n_1+…+n_k=n ist.
Dann kann man einfach mittels n_i/n (i=1,…,k) die proportionp_i ausrechnen mit der Merkmal X_i vorkommt.
Das (explorative) 95%KI für p_i erhält man dann über das Wilson Score interval (as kann ich dir eingescannt schicken, im Grunde ist das recht einfach aber die Lit dazu liest sich recht kompliziert), das du mittels R (-> http://www.r-project.org/) oder sogar Excel berechnen kannst (falls du R verwendest, kann ich dir auch den Code schicken).
Um dann allerdings eine vorgebene Breite des Konfis zu erhalten muss man n, n_1,…n_k simulieren und schauen wie groß die sien müssten, damit man die vorgegebene Breite erreichen würde. Das ist etwas Aufwand, mit R aber kein großes Ding. Du müsstest nur bedenken, dass du alle KIs simultan begrenzen willst, das macht es geringfügig komplizierter.
Damit erhälst du dann ein gesamt n und die n_1,…,n_k, die du treffen müsstest (vorausgesetzt deine Annahmen über p_i stimmen).
Das war’s dann, anschließend muss man dann die Stichprobe ‚ziehen‘ und etwas hoffen.
Klar sollte sein, dass je mehr Merkmale mit je mehr Kategorien und je kleiner die Breite des KI sein soll die Gesamtgröße steigt.
Viele Grüße,
JPL