Wie groß muss n sein, damit Umfrage repräsentativ?

Hallo,

ich würde mich extrem über jegliche Hilfe bezüglich folgender Fragestellung freuen:

Ein Unternehmen will die Teilnehmer von Schulungen über deren Qualität befragen. Aus der Grundgesamtheit (z.B. 50 Schulungsteilnehmer von unterschiedlichen Firmen) werden dann die Teilnehmer der interessierenden Firma (z.B. 15) befragt. Die Umfrage besteht aus insgesamt 10 verschiedenen Items, die auf einer Skala von 1-4 (garnicht zufrieden - voll zufrieden) jeweils verschiedene Zufriedenheiten abfragen (Zufriedenheit mit dem Auditor, Zufriedenheit mit den Materialien etc).

Meine Frage nun: Wie wievle ausgefüllte Umfragenzettel müssen mindestens vorhanden sein, damit das Ergebnis für die Gesamtpopulation (= alle Teilnehmer) repräsentativ ist?

Ich habe im Internet folgende Formel gefunden:

n= (t^2*p*q)/(t^2*p*q)+(e^2 (N-1))

Ich weiß allerdings nicht, wie sie heißt, wo sie herkommt und ob ich sie überhaupt verwenden darf. Zumal ich mir keinen Reim aus p und q (Anteil der Elemente in Stichprobe, die Merkmal aufweisen / nicht aufweisen --> was genau ist den mein Merkmal? Zufriedenheit? Da gibt es ja Abstufungen…) machen kann.

Vielen Dank für alle Gedanken zu diesem Thema!

Hallo EmmasTanteEmma,

Repräsentativität hat eher mit der Güte des Stichprobenplans als mit der Stichprobengröße zu tun, der obige Ansatz ist also m.E. verfehlt, dennoch der Versuch Licht ins Dunkel zu bringen, ich gehe von gängigen Abkürungen aus:

t: Zeit (Anzahl Messeungen?)
p: Anteil (aus einer Gruppe)
q: 1-p (der 'Gegen’anteil)
e: Eulersche Zahl (Antilogarithmus)
N: Größe der Population

zu deinen p-Überlegungen: wenn in der Pop 55% Frauen sind, dann ist p=.55, q=.45

VG, Walter.

Hallo Walter,

Vielen Dank für diese rasche Antwort! Dass das ganze Unterfangen mathematisch nicht 100% richtig ist, ist klar… dafür hätte man sich Gedanken über ein Auswertungsverfahren machen müssen, BEVOR die Items der Meinungsumfrage entworfen wurden :smile:

Aber meine Aufgabe lautet nun: Finde heraus wie groß n sein muss, damit die Meinung der Stichprobe die Meinung der Gesamtpopulation bestmöglich abbildet.

Vielleicht hast du da noch weitere Gedanken oder einen anderen Ansatz?

Lieben Dank,

Emma

Hallo,

zu dem Thema empfehle ich die folgenden Texte:

http://www.von-der-lippe.org/dokumente/Wieviele.pdf

http://www.von-der-lippe.org/dokumente/Repraesentati…

Viele Grüße

Andreas

Hallo Andreas,

Vielen Dank, diese beiden pdf Files habe ich mir auch schon durch gelesen, bin ehrlich gesagt hinterher aber auch nicht schlauer.

Ich bin jetzt noch auf die Cochran-Formel gestoßen mit der man die Stichprobengröße wohl errechnen kann, weiß aber auch nicht ob das richtig und zulässig ist?

Liebe Grüße

Hallo,

ich wollte mit dieser Literaturempfehlung vor allem zu Ausdruck bringen, dass ich (und ich bin bei weitem nicht der einzige Statistiker, der so denkt) diese ganze Idee der „Repräsentativität“ für ausgemachten Quatsch halte, was - wie ich denke - in den beiden Papieren recht gut begründet wird.

Was deine Frage nach dem Stichprobenumfang angeht, kann ich dazu sagen: Der notwendige Stichprobenumfang wird in der Regel in Abhängigkeit von der gewünschten Breite eines Konfidenzintervalls berechnet. Dass ist insofern auch ziemlich simpel (vgl. ein Statistikbuch deines Vertrauens), wenn die Verteilung der Variable bekannt ist und noch viel einfacher, wenn die Variable normalverteilt ist. Das ist bei dir nun nicht der Fall. Du hast das Problem, dass deine Variable sogar nicht einmal metrisch skaliert ist, was die Sache hundertfach problematischer macht.

Meine Empfehlung also: Vergiss den ganzen Blödsinn mit der Repräsentativität und mach dir auch keine Gedanken über einen notwendigen Stichprobenumgfang. Erhebe deine Daten in einer Menge, wie es mit vertretbarem Aufwand möglich ist (je mehr desto besser) und werte die Daten dann vernünftig aus. Wenn eine Auswertung nur auf der Basis einer deskriptiven Statistik möglich ist, dann ist das (wenn es gut gemacht ist) nicht ehrenrührig und sollte dir durchaus brauchbare Erkenntnisse liefern.

Viele Grüße, Andreas

Hallo,

Ja, dass die Repräsentativität ziemlich überbewertet wird habe ich aus den Quellen auch herausgelesen :smile: Als fast fertige Psychologiestudentin habe ich natürlich nicht das nötige Fachwissen, durchaus aber ein gewisses Grundverständnis was die statistische Auswertung von Fragebögen ausgeht.

Die Firma, in der ich während den Semesterferien arbeite hat mich nun mit eben dieser Aufgabe beauftragt: Finde heraus, ab wie vielen Antwortbögen davon ausgegangen werden kann, dass die Stichprobenergebnisse auf die Grunspopulation verallgemeinerbar sind. Mein erster Ansatz war: Ich kenne ein solches Verfahren nicht und denke, dass die Stichprobengröße eine reine Definitionssache ist.

Ich wurde allerdings gebeten genauer nachzuforschen und jetzt bin ich eben am recherchieren :smile:

Wie sähe denn ein möglicher - wenn auch hundert mal kompliziertere - Weg aus, um diese Fragestellung zu lösen?

Vielen Dank

Hallo liebe EmmasTanteEmma,
ich kenne keine formel, die dir diese frage beantworten könnte, kenne mich in dem bereich aber auch nicht wirklich gut aus. ich hätte eher gedacht, dass es darum geht wie gut man die umfrageteilnehmer aussucht - wenn man z.b. von allen teilnehmern das alter gegeben hat, dass man dann nicht gerade einen teilnehmer nimmt der deutlich älter/jünger als der druchschnitt, usw.
die sog. mindest-n-formel, die ich ansonsten kenne, dient allein dazu im vorhinein zu bestimmen wie viele versuchsteilnehmer man in einem experiment bräuchte, um mit einer gewissen chance bei einem statistischen test der erhobenen daten auch tatsächlich ein signifikantes ergebnis heraus bekommen zu können. da du ja aber nichts statistisch testen willst, ist diese formel, denke ich, für dich nicht relevant.
ich hoffe dies hilft dir zumindest ein bisschen weiter…
viele liebe grüße von
hannah

Heyho :smile:

Also ich denke, dass es keine allgemeingültige Formel für die Errechnung der Stichprobengröße gibt, weil das je nach Kontext variiert. Ich kenne nur als allgemeingültige Regel, dass man mindestens 30 Objekte braucht um statistische Auswertungen machen zu können. Ich denke, dass wäre dann auch in deinem Fall die relevante Orientierungsgröße.

Liebe Grüße

Hallo!

Deine Frage hat gleich mehrere Haken. Erstens sind die Teilnehmer EINES Unternehmens unter Umständen gar nie repräsenatativ für die Gesamtheit der Teilnehmer (könnten ja Personen aus einer speziellen Branche, mit speziellen Vorbildungen, … sein).

Zweitens ist die Frage nicht wie viele ausgefüllte Bogen du brauchst um repäsentative Ergebnisse zu erhalten, sondern mit welcher Unsicherheit du leben kannst.

Grüße
Robert

Hallo Robert,

da hast du Recht, natürlich ist das Ganze eher Pseudowissenschaftlich zu betrachten. Trotzdem lautet meine Aufgabe eben, Wege zur Berechnung zu finden.

Mal abgesehen von der Frage, ab wievielen Fragebögen die Umfrage als (möglichst) Repräsentativ (könnte man evtl nicht auch mit Konfidenzintervallen arbeiten) angesehen kann interessieren auch Korrelationen zwischen den einzelnen Items. Wäre es denn zulässig, diese auf herkömmliche Art und Weise (also bei den hier ordinalskalierten Daten mit Spearman Rangkorrelation) zu rechnen?

Vielen Dank und liebe Grüße

Ich fürchte ja, dass du auch mit meiner zweiten Antwort nicht zufrieden sein wirst…

Welche WertePAARE willst du denn mit der Spearman Rangkorrelation vergleichen? Bist dir sicher, dass du da irgendwas hast?

Wenn du dir die t-Werte Tabellen ansiehst, wirst du feststellen, dass n=7 in etwa die Größenordnung ist, bei der die Unsicherheiten sich langsam in einem erträglichen Maß bewegen. Ganz ohne Bereichnung - die kannst du mit den Angaben eh nicht durchführen weil nicht klar ist was du berechen sollst/willst. Sag einfach so - unter 7 ist’s immer Schrott; das Setup mit dem Befragen von Mitarbeitern eines Unternehmens um auf die Grundgesamtheit zu schließen ist noch ein zweiter Garant dafür Schrott, zu liefern.

Viele Grüße
Robert

Hm, die Idee wäre gewesen zu berechnen, inwiefern z.B. die Zufriedenheit mit dem Zeitpunkt einer Schulung mit der (subjektiv) angegebenen Effizienz zusammenhängt. Da die Daten ordinalskaliert sind dachte ich, eine Rangkorrelation wäre Mittel der Wahl… aber du hast Recht, ich habe keine Ahnung welche Paare ich da vergleichen sollte.

Allerdings führen große Unternehmen diese Umfragen ja auch durch, deswegen hatte ich die Hoffnung das es irgendeine Möglichkeit gibt an halbwegs sinnvolle Ergebnisse zu kommen.

Was genau ist denn an dem Versuch, von den Teilnehmern der Firma X auf die restlichen Teilnehmer zu schließen Schrott? Es kann zum Beispiel angenommen werden, dass alle Teilnehmer die selbe Vorbildung besitzen und aus der selben Branche stammen. Natürlich sind individuelle Differenzen und andere Einflussfaktoren gegeben, aber das ist ja bei jeder wissenschaftlichen Studie auch so. Oder geht es darum, dass keine Zufallsauswahl erfolgen kann?

Liebe Grüße

Hallo,

du müsstest auf jeden Fall in nicht parametrische (oder verteilungsfreie) Verfahren auf der Basis von Rangordnungsstatistiken einsteigen. Ich weiß ehrlich gesagt nicht, was hier an konfidenzintervallähnlichen Konstrukten exisitert. Auf jeden Fall bräuchtest du so einen Ansatz und könntest diesen dann in Richtung Stichprobenumfang umformen. Vielleicht hilft dir das bekannte Buch von Büning/Trenkler dabei weiter (kann ich aber nicht versprechen).

Viele Grüße

Andreas

Hi,

repräsentativ sind Stichproben dann, wenn sie die zu untersuchende Grundgesamtheit in etwa widerspiegeln, d.h., wenn die Ausprägungen der sie kennzeichnenden Merkmale in etwa derselben Häufigkeit vorkommen.

Grüße,
JPL

Huhu,

Genau… aber kann man das irgendwie testen? :smile:

Lg

Hey :smile:

Könntest du mir sagen, woher diese Regel kommt? Das wäre ja auch eine Lösung, nur bräuchte ich eine entsprechende Quelle. Es hat wahrscheinlich etwas mit der Normalverteilung zu tun, oder? Bloß bin ich mir nicht sicher, ob ich hier eine NV annehmen darf…

Liebe Grüße

Vielen Dank für den Tip, hab mir das Buch mal in der Bücherei vorgemerkt.

Warum genau brauche ich denn ein parameterfreies Verfahren? Weil ich nicht weiß, ob und wenn ja welche Verteilung die Umfrage hat?

Liebe Grüße

Hi,

testen wäre eigentlich ein wenig overdone.
Im Grunde würde man die Häufigkeiten der Merkmale der Stichprobe mit der der Grundgesamtheit vergleichn, fertig.
Klar kann man auch proportionen testen, aber das würde in ein Multiplizitätsproblem führen. Also wäre der Ansatz über ein Schätzproblem vermutlich zielführender, d.h.: wie groß müsste die Stichprobe sein, damit das 95% Konfi für die proportion von Merkmal X eine maximale Breite von z hat? Wobei z noch gewählt werden müsste.

Viele Grüße,
JPL

Hey,

Das hört sich aber doch mal sehr gut an! Wie würde ich diese Fragestellung denn angehen („wie groß müsste
die Stichprobe sein, damit das 95% Konfi für die proportion von Merkmal X eine maximale Breite von z hat“)?

Kannst du mir vielleicht einen Lösungsansatz aufschreiben? Oder muss ich einfach nur die Formel umstellen? Und ist das mit dem Konfidenzintervall für meine „Verteilung“ (die ja irgendwie eigentlich keine ist) zulässig?

Vielen Dank, du hast mir sehr geholfen!

Liebe Grüße