Rückschluss von Stichprobe auf Gesamtheit

Hallo zusammen,

ich habe folgendens Problem.

Ein Unternehmen hat eine Kundenbefragung durchgeführt, deren Ergebnisse ich nun interpretieren soll.

Als erstes ist mir dabei aufgefallen, dass die Anzahl der Kunden, die den Fragebogen zurückgeschickt haben im Verhältnis zur Gesamtheit sehr gering ist. 15.000 zu 105, also deutlich unter 1%.

Gefragt wurden die Kunden, wie Zufrieden sie mit einem bestimmten Produkt des Unternehmens waren, auf einer Skala von 1 bis 6.

Die einzigen weiteren Infos die ich habe sind die Altersstruktur der Gesamtheit und der Kunden, die den Fragebogen beantwortet haben.

Ich habe Zweifel daran, dass 105 Antworten reichen um valide Aussagen über die Gesamtheit zu treffen. Leider habe ich im Moment keine Idee, wie ich prüfen kann, ob meine Befürchtungen berechtigt sind oder nicht.

Zudem bin ich nicht sicher, ob die Kunden, die überhaupt einen Fragebogen bekommen haben, wirklich zufällig ausgewählt wurden oder ob die Kunden so ausgewählt wurden, dass sie z. B. der Altersstruktur der Gesamtheit entsprechen. Soweit ich das bisher nachgeforscht habe, ist das für die Beurteilung auch relevant.

Kann mir jemand sagen, die ich Ausrechnen kann, wie hoch die Wahrscheinlichkeit dafür ist, dass sich die Aussagen der 105 auf die Gesamtheit übertragen lassen?

Vielen Dank für eure Hilfe

powerblue

Hallo powerblue,

bei dem von Ihnen geschilderten Sachverhalt handelt es sich nicht um ein mathematisches Problem. Daher ist das Angehen des Problems auch kein mathematisches, bei dem man durch eine Formel einen Wert berechnen kann, der dann schon für sich steht, ohne einer Interpretation zu bedürfen.

Es handelt sich um ein Problem der Versuchsplanung/Interpretation im Rahmen einer Marktforschungsfragestellung.

Zudem bin ich nicht sicher, ob die Kunden, die überhaupt einen
Fragebogen bekommen haben, wirklich zufällig ausgewählt wurden
oder ob die Kunden so ausgewählt wurden, dass sie z. B. der
Altersstruktur der Gesamtheit entsprechen. Soweit ich das
bisher nachgeforscht habe, ist das für die Beurteilung auch
relevant.

Das ist der eigentliche Anfang. In der Versuchsplanung sollten genaue Forschriften getroffen worden seien, wie die Stichprobe selektiert wird. Nur dann können Statistiken hinsichtlich der Generalisierbarkeit auf die Population getroffen werden. Vielleicht hat das Unternehmen diese Forschriften irgendwo.

Als erstes ist mir dabei aufgefallen, dass die Anzahl der
Kunden, die den Fragebogen zurückgeschickt haben im Verhältnis
zur Gesamtheit sehr gering ist. 15.000 zu 105, also deutlich
unter 1%.

Gefragt wurden die Kunden, wie Zufrieden sie mit einem
bestimmten Produkt des Unternehmens waren, auf einer Skala von
1 bis 6.

Hier hilft ein wenig psychologisches „Sich-Hinein-Versetzen“: Welche Kunden sind motiviert, einen Fragebogen über ihre Zufriedenheit zurückzuschicken? Es sind i. d. R. diejenigen, die eine extreme Meinung haben. Die sehr zufriedenen wollen etwas von ihrer Zufriedenheit zurückgeben. Aber noch viel wichtiger: Die sehr unzufriedenen wollen ihrem Ärger Luft machen.

Die einzigen weiteren Infos die ich habe sind die
Altersstruktur der Gesamtheit und der Kunden, die den
Fragebogen beantwortet haben.

Theoretisch wäre es möglich, die demografischen Daten ihrer Stichprobe mit denen der Population zu vergleichen. Das hilft Ihnen aber wenig, wenn die von mir oben geschilderten Möglichkeiten zutreffen. Es gibt nämlich keinen Grund anzunehmen, dass sich die Gruppe der sehr Zufriedenen und die der sehr Unzufriedenen, also diejenigen, die motiviert waren, den Fragebogen zurückzuschicken, demographisch von der Population unterscheiden.

Ich habe Zweifel daran, dass 105 Antworten reichen um valide
Aussagen über die Gesamtheit zu treffen. Leider habe ich im
Moment keine Idee, wie ich prüfen kann, ob meine Befürchtungen
berechtigt sind oder nicht.

Sehr berechtigte Zweifel.

Viele Grüße

Hans-Peter

Hallo,

vielen Dank für deine Antwort.

Vielleicht ist das im Ursprungsposting nicht deutlich geworden. Die Befragung wurde schon durchgeführt, bevor in involviert war. Sonst wäre sie bestimmt anders gelaufen.

Was den mathematischen Zusammenhang betrifft, weiß ich wie man den Minstest-Stichprobenumfang bei einer echten Zufallsstichprobe berechnet (für ein gewähltes Konfidenzniveau). Ich hatte gehofft, dass es für diesen konkreten Fall eine Möglichkeit gibt, vom Stichprobenumfang das Konfidenzniveau zu errechnen.

Da ich keine Zufallsstichprobe habe, geht das scheinbar aber leider nicht.

Im Ergebnis habe ich die Struktur der Stichprobe mit der Gesamtheit verglichen, anhand verschiedener Kriterien (ich konnte außer Altersstruktur noch andere finden). Passte überhaupt nicht zusammen…

Grüße

powerblue

Hallo!

Vielleicht ist das im Ursprungsposting nicht deutlich
geworden. Die Befragung wurde schon durchgeführt, bevor in
involviert war. Sonst wäre sie bestimmt anders gelaufen.

Das hatte ich verstanden. Ich hoffte nur, man könnte noch irgendwelche Aufzeichnungen über die schon gelaufene Prozedur bekommen oder jemand fragen, der damit betraut war.

Was den mathematischen Zusammenhang betrifft, weiß ich wie man
den Minstest-Stichprobenumfang bei einer echten
Zufallsstichprobe berechnet (für ein gewähltes
Konfidenzniveau). Ich hatte gehofft, dass es für diesen
konkreten Fall eine Möglichkeit gibt, vom Stichprobenumfang
das Konfidenzniveau zu errechnen.

Da ich keine Zufallsstichprobe habe, geht das scheinbar aber
leider nicht.

Ganz genau!

Im Ergebnis habe ich die Struktur der Stichprobe mit der
Gesamtheit verglichen, anhand verschiedener Kriterien (ich
konnte außer Altersstruktur noch andere finden). Passte
überhaupt nicht zusammen…

Es muss also irgendwelche Faktoren geben, die beeinflussen, wer Responder (hat Fragebogen zurückgeschickt) und Non-Responder ist. Manchmal kann es auch interessant sein, das zu untersuchen.

Viele Grüße

Hans-Peter