Statistische Repräsentanz

Ihr Lieben,

ich bin in den letzten Zügen meiner Doktorarbeit. Ursprünglich hatte mich auf eine qualitative Arbeitsweise ausgerichtet, aber dann kam da das Leben und sehr großzügige Feldforschungskonditionen dazwischen und nun geht es doch in die empirische Richtung.

Meine Fragestellung bezieht sich auf sakrale Orte, genauer Tempel. Dieser ihrer habe ich 45 Stück untersucht, eine handvoll weitere nicht von mir untersuchte Tempel dienen als Referenz.

Nun erhalte ich immer wieder die Frage, ob meine Aussagen, zu dem was mit diesen Tempeln geschehen ist, repräsentativ ist. Das weiß ich aber selbst nicht, da meine statistische Ausbildung recht rudimentär ist.

Ich habe versucht mich zu dem Thema zu belesen, aber ich finde primär Erklärungen und Beispiele zu Fragen und Umfragen bezüglich Personen und Probanden. Es geht bei mir aber nicht um Personen, sondern um Architektur und dazu kommt, dass eine Gesamtzahl nicht bekannt ist.

Genauer geht es um Tempel bestimmter Religionen mit einem bestimmten Fokus, es ist aber für alle betroffenen Länder nicht bekannt, wie viele Tempel dieser Religion mit diesem Fokus es überhaupt gibt (dies zu ermitteln wäre selbst ein jahrelanges Forschungsprojekt). Auch ohne Fokus ist die Gesamtzahl der Tempel von Religion A, B, oder C nicht bekannt, also auch nicht welchen Anteil davon Fokus Y ausmacht.
Ferner habe ich mir angelesen, dass es ja nicht um konkrete Zahlen geht, sondern darum, ob man Stichproben der richtigen Menge genommen hat. Das wäre also „Tempel von Religion A mit Fokus Y“. Ich habe nun mehrere Tempel von Religion A, B und C mit dem Fokus auf Y, denen allen etwas ähnliches (Resultat = R) geschehen ist.

Kann mir jemand erklären (und evtl. weiterführende Links vermitteln) wie ich feststellen kann ob meine 45 toten Dinge (= nicht Menschen), die ich studiert habe, repräsentativ für R sind?

Mir fehlt es da leider an Basismethodik.

beste Grüße,
Kate

Gratuliere zum erfolgreichen Karriereweg!
(Ich hab dich ja schon ewig nicht mehr hier gelesen)

Das mit der „statistischen Repräsentativität“ ist keine so leichte Angelegenheit, auch weil dieser Begriff nicht von jedem gleich verstanden wird.

Grundsätzlich ist eine Untersuchung dann „statistisch repräsentativ“, wenn man statistisch-quantitativ von der „Stichprobe“ auf die „Grundgesamtheit“ schließen kann.

Es ist nicht wichtig, wie viele es gibt, aber es ist wichtig, dass klar ist, ob deine Auswahl einigermaßen zufällig erfolgt ist oder ob sie von vorn herein einen bias hat.

Wenn du z.B. über die Fensterfarbe von Tempeln arbeitest, dann musst du nicht wissen, wie viele Tempel es gibt, aber es ist unsinnig zu glauben, deine Arbeit könnte repräsentativ sein, wenn du nur mitteleuropäische Tempel in die Stichprobe genommen hast, oder nur die des 16. Jhdts.

Wenn du dagegen einigermaßen von Zufallsstichprobe ausgehen kannst (oder alternativ halt die Definition der Grundgesamtheit entsprechend enger machst), dann musst du über die GG nicht viel wissen.

Ganz grob: Du bereitest deine Werte auf, berechnest aus diesen einen Mittelwert und die Standardabweichung dazu und kannst dann z.B. mit der Formel: MW ± 2xStandardabweichung das übliche 95-%-Konfindenzintervall angeben, sprich den Bereich, in dem der „wahre Wert“ der Grundgesamtheit zu 95% zu erwarten ist.

Je größer deine Stichprobe ist, desto enger kannst du das 95%-KI (oder auch 90%-KI oder 99%-KI) fassen, d.h. desto aussagekräftiger wird es.
Es geht aber dabei nicht um eine fixe Grenze, ab wann etwas „repräsentativ“ ist.
Eher um die Frage, ob in der Untersuchung überhaupt statistische Repräsentativität angestrebt wurde.

https://www.uni-siegen.de/phil/sozialwissenschaften/soziologie/mitarbeiter/ludwig-mayerhofer/statistik/statistik_downloads/statistik_i_4.pdf

Beachte, dass n nicht entscheidend für „repräsentativ“ ist.
Man kann nicht pauschal sagen. ab n>sounso ist es repräsentativ und für n<soundso nicht.
Das hängt von vielen Faktoren ab, welche n für welche Intervalle nötig sind.
Kann man im Grund vorher durchaus abschätzen, um zu wissen, welchen Stichprobenumfang man benötigen wird, aber das ist eine einigermaßen komplexe Rechnerei.

Mir leider mit zunehmende Abstand vom Studium auch mittlerweile :wink:

Gruß
F.

2 Like

Danke!
Es frisst auch wirklich viel Zeit und trotzdem habe ich jetzt nur noch sieben Monate zum fertigschreiben was eeecht knapp ist (ich habe leider etwas Zeit verloren weil ich auf Gelder zur Feldforschung warten musste und ohne die ging nix, jetzt hab ich kaum noch Zeit, die erbeuteten Quellen auszuwerten).

Vielen Dank für deine Erläuterungen, ich werde mich mal in die Fachbegriffe einlesen denn Statistik ist echt nicht meins (ich hatte leider nie die Gelegenheit einen „Statistik für Soziologen“ Kurs o.ä. zu besuchen, jetzt beißt mich das ganz schön.)

Ich weiß auch nicht ob ich statistische Repräsentativität anstrebe. Ich will aber vorbereitet sein, wenn die Frage spätestens in der Disputation wieder aufkommt.

Punkt ist dieser:
Ich möchte

  1. eine Aussage zu Weg und Erfolg des Ideologietransfers von der transregionalen auf die lokale Ebene machen
  2. Eine neue Methode der Architekturanalyse einführen.
    Das sind natürlich zwei sehr unterschiedliche Ziele und 1) lässt sich leichter auf eine geringe Fallzahl runterbrechen als 2).

Meine Grundgesamtheit wären also Tempel, die:
In Sichuan oder Vietnam stehen, bereits vor 1850 existierten, topographisch oder via Toponym mit Wasser verbunden sind und an irgendeinem Punkt in ihrer Existenz zur Wasserkontrolle (Gebete für/gegen Regen/Fluten) genutzt wurden und an irgendeinem Punkt in ihrer Existenz (vor 1850) einen bautechnischen/kunsthistorischen Eingriff von einer transregionalen Kraft (religiös oder politisch) erlebten.

Anhand dessen habe ich Paradigmen erarbeitet, die Antworten zu 1) liefern, die sich aber nur durch Anwendung der neuen Methodik 2) erarbeiten ließen.

Ich denke also, meine Tempel sind für diese ziemlich enge GG repräsentativ.
Für die grundsätzliche Anwendbarkeit der Methodik 2) sind sie wahrscheinlich repräsentativ, weil GG so eng definiert ist.
Wenn ich da richtig liege, wäre das auch keine Katastrophe, denn ein Hauptziel meiner Arbeit ist es zu zeigen, dass Methodik 2) auch historisch anwendbar ist, und das wäre sie demonstrativer Weise durch die Ergebnisse aus 1) ja.

Denke ich da richtig?

beste Grüße,
Kate

Ich möchte da nochmal kurz einhaken:
Bei der Frage der „statistischen Repräsentativität“ geht es v.a. um die Art der Auswahl der Untersuchungseinheiten.
Wenn ich dich richtig verstanden habe, hast du die Daten eh schon erhoben und musst sie nun auswerten.
Damit hast du dich (mit dem Verzicht auf eine echte Zufallsauswahl) im Grunde ja bereits gegen den Anspruch auf „statistische Repräsentativität“ entschieden.
Deine Aufgabe für die Disputatio bestünde dann lediglich darin, deine Vorgehensweise erkennen und begründen zu können.

Was aber natürlich dennoch möglich ist, ist es, deine Daten oder einen Teil deiner Daten deskriptiv-statisch auszuwerten: Maße für die Mittelwerte und die Streuungen erstellen, Korrelationen berechnen usw.
Das hat dann aber mit „stat. Repräsentativität“ an sich nichts zu tun.
In diese Deskriptive Statistik (in Gegensatz zur viel komplexeren Inferenzstatistik, die mit Stichprobe/Grundgesamtheit-Zusammenhängen verbunden ist) kannst du dich auch relativ schnell einarbeiten, für mehr hätte die verbliebene Zeit eh nicht gereicht und scheint mir für deine Arbeit auch gar nicht nötig.

Gruß
F.