Vollerhebung. Wie Repräsentativität herstellen?

Hallo,

ich schreibe gerade eine Arbeit und komme aufgrund unzureichender statistischer Kenntnisse nicht weiter.

ich habe bei einer Grundgesamtheit von ca. 850 Institutionen eine Vollerhebung durchgeführt.

Dabei habe ich ca. 2000 Leitende Personen dieser Institutionen angeschrieben. (Online)

zurückerhalten habe ich nun ca. 300 vollständige Fragebögen aus ca. 250 der 850 Institutionen.
Damit habe ich Meinungen aus ca. 30% der Institutionen.

Mir stehen zu den Institutionen nun verschiedene Eigenschaften zur Verfügung (die ich für die Studie alle als wichtig erachte):

  • Welche von 3 möglichen Produkten sie anbieten (es können auch alle 3 angeboten werden)
  • Wie diese jeweils angeboten werden (hier gibt es wiederum 3 Möglichkeiten pro Produkt)
  • Die Größe der Institution anhand von Umsatzzahlen (diese variieren allerdings auf Grund des Produktes und der Möglichkeit wie diese angeboten werden)
  • Die Region aufgrund der PLZ

Nun habe ich bereits festgestellt, dass die Rücklaufquote anhand der genannten Kriterien nicht exakt der der Grundgesamtheit entspricht (Relationen der Häufigkeiten von Grundgesamtheit zu Rücklauf verglichen.). Allerdings kann ich auch, zumindest anhand dieser Kriterien, keine groben systematischen Ausfälle feststellen.

Nun meine Fragen:
Wie kann ich denn in meinem Fall eine Repräsentativität im Bezug auf die Grundgesamtheit ermöglichen/beweisen? Geht das hier überhaupt?
Gibt es Vorgehensweisen, die in meinem Fall anzuraten wären?
Kann nicht generell immer von einem systematischen Ausfall ausgegangen werden, da vielleicht alle die nicht geantwortet haben Einstellung XY vertreten?
Wie könnte ich eine geschichtete Quoten-Stichprobe erstellen, bei der vielzahl an Variablen und der geringen Zahl an Befragten.

Hallo Chrush77,

wie ich es sehe, hast du eine Population befragt und nur einen Teil an Antworten bekommen. Repräsentativität ist eine Idee, an die du sich jetzt heran schleichen musst. Das geht aber nicht ohne (a) Annahmen oder (b) Wissen bzw beides. Eigentlich musst du aus Annahmen bzw., Wissen über die Population eine Zielverteilung erstellen, mit der du die Stichprobe vergleichst, es scheint mir, als habest du so etwas schon unternommen. Wenn es grobe Abweichungen gibt, dann musst du durch Gewichtung die Stichprobe der Population anpassen, dabei das n aber beibehalten. Bei SPSS geht das über ‚weight by n‘.

Wenn aber -wie es auch scheint- keine stärkeren Abweichungen fest zu stellen sind, dann belass es dabei und schreibe auf, warum Population und Stichprobe bzgl kritischer Variablen ähnlich sind. Von geschichteter Quotenstichprobe halte ich wenig; damit erhält man einen Probandengewinnungsplan, der aber mit Repräsentativität nicht unbedingt estwas zu tun hat, da ist dein Versuch einer Zufallsstichprobe schon besser.

Du schreibst nun, dass du sehr viele Variablen hättest (vielleicht ist der Rücklauf deswegen so schlecht :wink:. Damit ist einfach umzugehen, indem du Gruppen von Variablen zusammenfasst. Da mache ich aber ein Fass auf. Wenn du mit Indexbildung wenig Erfahrung hast, musst du dich beraten lassen (Stichwort: Skalen, Reliabilität; Eindimensionalität).

Summa summarum sehe ich nicht so schwarz.

Gruß, Walter.

Hallo Chrush77,
solange dir keine plausiblen Gründe für einen systematischen Ausfall einfallen (und du auch keinen solchen feststellt), brauchst du dir um die Repräsentativität keine Gedanken machen.
Wenn z.B. prozentual gesehen deutlich weniger West- als Ostdeutsche Unternehmen deinen Fragebogen ausgefüllt haben, kannst du evtl. noch einen t-Test für unabhängige Stichproben rechnen um zu schauen, ob es tatsächlich Unterschiede bzgl eines oder mehrerer Merkmale gibt.

VG

Hallo Walter,

vielen Dank für deine Antwort! :smile:

Ich habe jetzt folgendes versucht:

Über die Häufigkeiten der ersten Zahl der Postleitzahl untersuche ich, ob es systematische Ausfälle gibt, was die Region betrifft. Diese bestehen nicht (in einer Grafik schön darstellbar)

Als 2. Schritt habe ich die Verkaufszahlen der Produkte in 4 Bereiche eingeteilt:
0 Keine Verkaufszahlen für Produkt X
Für 1-3 habe ich mir angesehen: Wie viele Betriebe
(n) haben Verkaufszahlen für Produkt X?
Abgeleitet von der Gaußschen Glockenkurve habe ich diese dann wie folgt in Gruppen verteilt)
1 Kleiner Betrieb (20% von n)
2 Mittlerer Betrieb (60% von n)
3 Großer Betrieb (20% von n)

Das Ergibt dann einen 4-Stelligen Code, der Aussagt,
Welche Produkte in welcher Große ein Betrieb führt.

Ingesamt gibt das auf Grund der Grundgesamtheit
61 Variationen, deren Häufigkeiten ich ausgewertet habe.

Das selbe habe ich mit dem Rücklauf gemacht.

Ersteres geteilt durch zweiteres ergibt dann die Quote mit der ein Fall gewertet werden muss.

Per S-Verweis dann zugeordnet, in SPSS übertragen und dann alle Fäll nach dieser Spalte gewichtet.

Macht das Sinn?

Hallo Paul,

Vielen Dank für deine Antwort :smile:

Hallo Chrush77,

du kannst vorgehen wie beschrieben. Mir scheint aber jetzt schon, dass du durch deine GEwichtung keine größeren Unterschiede feststellen wirst.

Mach es einfach mal und führe dann Analysen durch, die nicht darauf angelegt sind die Daten zu melken (also keine schrittweise Regression zB). Vergleiche dann deine Koeffizienten (am besten Effektmaße). Wenn alles ähnlich heraus kommt, dann verzichte auf die GEwichtung. Solche Sachen sehen immer so aus, als habe man versucht ein bestimmtes Ergebnis herbei zu rufen. Im Methidenteil wirst du das ansatzweise beschreiben, also systematisch erklären, welche Schritte du unternommen hast, um die Güte der Stichprobe zu beschreiben.

Viel erfolg,

Walter.

Hallo Walter,

ich möchte mich nochmal ganz herzlich für deine Antwort bedanken! Du hast mich auf den richtigen Trichter gebracht!

Ich bin nun wie beschrieben vorgegangen und habe die Fälle anhand des Kombinierten Faktors aus Marke und Umsatzgröße im Vergleich zur Grundgesamtheit gewichtet.

Damit sind nun nahezu alle geclusterten Betriebs-Größen-Produkt-Kombinationen die möglich sind in meinem Rücklauf genau so stark vertreten wie in der Grundgesamtheit.
Anhand dieser Gewichtung habe ich nun nochmal die Regionsverteilung anhand der ersten PLZ-Zahl zur Grundgesamtheit verglichen.
Diese hat sich sogar noch verbessert!

Damit sollte meine Umfrage Repräsentativ sein :smile:

Ich werde noch prüfen ob - wie du ja sagst - ohne oder mit Gewichtung überhaupt einen wesentlichen Unterschied macht; aber ansonsten sieht das super aus!

Vielen vielen Dank!

Kleiner Nachtrag:

Es scheint so, als hättest du recht - ob ich in meinem Fall die Gewichtung an oder ausknipse, verändert die Prozent-Werte nur margninal. :smile: :smile:

Damit sollte jetzt alles glatt gezogen sein!

Danke!

Hallo,

ich an Deiner Stelle wäre zunächst stolz auf die wirkllich ordentliche Rücklaufquote. Da haben schon professionelle Institutionen deutlich weniger erreicht. Ich würde dann hingehen und deine Antworten solide deskriptiv auswerten, immer mit dem Hinweis, dass es sich dabei nur um die Antwortgruppe handelt. Asld letztes würde ich ein wenig darüber philosophieren, aus welcher Motivation der Rest nicht geantwortet hat. Da du ja sogar eine Vollerhebung hast, kannst du doch genau beschreiben, in welchen Bereichen sich deine Antworten bewegen würden, wenn alle geantwortet hätten.

WEnn du dich weiter mit dem Problem der Repräsentaitvität beschäftigen möchtest, empfehle ich dir folgendes Paper:

http://www.von-der-lippe.org/dokumente/187_Diskussio…

Viele Grüße, Andreas

ja, ja, so ein Näschen trügt selten.

VG, Walter.

Schwierig …
Also ich würde nicht automatisch von systematischem Ausfall ausgehen … sonst kann man ja gar nix mehr untersuchen.

Möglich wäre, zu gucken, ob die Ausfälle tatsächlich nicht systematisch sind, zB mehr Ausfälle bei größerer Produktvielfalt??? Ermittle mit Signifikanztest, wenn du kannst, ob sich die Anteile signifikant unterscheiden.

Aber selbst wenn: ist es denn so wichtig, für den Befragungsinhalt? Erst wenn es Grund zur Annahme gibt, dass ein Merkmal sich stark auf die Fragestellung auswirkt, würde ich da mehr Aufwand reinstecken.

FAlls du sowas findest, kann man zB eine Gewichtung machen, das geht relativ einfach und wirkungsvoll.

Hi!

Ich denke ich bin ein bisschen spät dran…

Teste doch einfach auf signifikante Unterschiede bei den einzelnen Merkmalen zwischen Grundgesamtheit und Stichprobe - ist da kein signifikatner Unterschied beim jeweiligen Merkmal kannst du die Daten verwenden.

Grüße!
Robert

Hi,

Nun habe ich bereits festgestellt, dass die Rücklaufquote
anhand der genannten Kriterien nicht exakt der der
Grundgesamtheit entspricht (Relationen der Häufigkeiten von
Grundgesamtheit zu Rücklauf verglichen.).

Sehr gut! Ich erlebe damit zum ersten Mal, dass sich jemand Gedanken zu dem Thema gemacht hat, was repräsentativität bedeutet.

Allerdings kann ich
auch, zumindest anhand dieser Kriterien, keine groben
systematischen Ausfälle feststellen.

rein deskriptiv? Das kann man gut in der Diskussion anbringen. Testen würde ich hier eher nicht.

Nun meine Fragen:
Wie kann ich denn in meinem Fall eine Repräsentativität im
Bezug auf die Grundgesamtheit ermöglichen/beweisen?

abweichungen gibt es immer. du kannst aber das ausmaß der abweichungen und deren möglichen Einfluß diskutieren.

Gibt es Vorgehensweisen, die in meinem Fall anzuraten wären?

Spontan weiß ich keine. du müsstest sonst eine literatur-recherche machen, was entsprechende Institute machen.

Kann nicht generell immer von einem systematischen Ausfall
ausgegangen werden, da vielleicht alle die nicht geantwortet
haben Einstellung XY vertreten?

Gegenfrage: kann ein systematischer Ausfall vorliegen, und deine Stichprobe trotzdem recht repräsentatuv sein? dann hätten deine Kennzahlen zu den Unternehmen nichts mit der Meinung XY zu tun, deretwegen sie nicht geantwortet haben.
Ferner müsste ihnen bewusst sein, DASS sie XY vertreten und das nicht offenlegen wollen. was wiederum bedeuten würde, dass dein Fragebogen nicht neutral in der formulierung ist.

Viele Grüße,
JPL

wie genau hast du geprüft ob „die Rücklaufquote anhand der genannten Kriterien nicht exakt der der Grundgesamtheit entspricht“? sind die relationen wirklich offensichtlich unterschiedlich? wenn es so ist dann wird man wohl auch eine systematik erkennen. ich denke dies zu klären ist der richtige ansatzpunkt für dein pauschal nicht lösbares problem.

welche relevanten Merkmale der Grundgesamtheit kennst Du? Ich habe ehrlich gesagt nicht kapiert, was Du überhaupt machen willst. Vielleicht kannst Du das präzisieren.

Hallo und sorry,

aber da kann ich dir leider nicht weiter helfen. Gruss robert