Stichprobenziehung - Wahrscheinlichkeitsrechnung - Repräsentativität

hallo,

steh grad vor einem kleinen/großen gedanklichen wirrwarr und hoffe ihr könnt mir da vielleicht weiterhelfen.

zur ausgangsbedingung/stichprobenziehung:

  • aus einer geographischen einheit wähle ich - nach einem bestimmten kriterium (zb. einwohnerzahl) - alle entsprechenden untereinheiten (also zb. alle städte/dörfer mit mehr als x Einwohnern.
  • aus der so erstellten liste potentieller einheiten, wähle ich dann - nach zufallsprinzip - stichprobenrelevante orte
  • aus den zufällig gewählten orten wähle ich dann - zb. entsprechen der einwohnerzahl und wieder nach dem zufallsprinzip - adressen für meine endstichprobe aus.

die problemstellung:

  • die kontakte der endstichprobe befrage ich dann jeweils zb. wie weit entfernt sie vom nächsten 2.000+m-berg wohnen (jedenfalls nach einem geographischen merkmal).

meine frage jetzt:

lässt sich in diesem fall die frage nach der entfernung des nächsten 2.000+m-gipfels von der wohnadresse repräsentativ berechnen? also auch mit entsprechender schwankungsbreite der ergebnisse? oder nicht? bzw. erfüllt die beschriebene stichprobenziehung die notwendigen kriterien? (die berggipfel und wohnorte werden sich ja nicht gleichmäßig und zufällig verteilen, sondern nach einem bestimmten anderen prinzip geordnet sein. oder habe ich mich da gedanklich grad irgendwie verheddert? :stuck_out_tongue:)

danke schonmal für die antwort. bin zuversichtlich, dass mir da wer weiterhelfen kann :smile:
feines wochenende schonmal

Hi sambold,
echt interessant. Bin mir aber nicht 100%ig sicher, ob ich dich richtig verstehe. Versuche aber eine sinnvolle Antwort zu finden.

Ablauf des Forschungsprojekts
Chronologisch muss als erstes die Fragestellung stehen und dann die Bestimmung der Stichprobe erfolgen. An deinem könnte die zentrale Fragestellung sein „Wie weit wohnt in Baden-Württemberg (geographische Einheit) ein Einwohner aus einer Stadt mit mehr als 5.000 Einwohnern aber weniger als 500.000 einwohnern durchschnittlich vom nächsten 2000+ Gipfel entfernt?“

Die Fragestellung gibt in diesem Beispiel schon erste Hinweise auf die Reduzierung der Stichprobenauswahl. 

Ist das Ergebnis repräsentativ? und Stichprobenauswahl
Wenn du eine entscheidende Grundverteilung durch die Vorauswahl missachtest, erhältst du m. E. kein repräsentatives Ergebnis. Wenn etwa 50 % der Bevölkerung in Ba-Wü in Städten unter 5.000 Einwohnern lebt, muss beim Ergebnis entweder darauf hingewiesen werden oder das Kriterium der Stichprobenauswahl angepasst werden.

Wenn du eine verallgemeinernde Aussage triffst: ebenso nein. Zum Beispiel: In Ba-Wü wohnen die Einwohner durchschnittlich 2,5 km vom nächsten 2000+ Gipfel entfernt. Die Reduzierung der Stichprobe nach Kriterium x oder y muss angegeben werden.

Wenn du berechtigten Grund zu deiner geäußerten Annahme hast, die Wohnort-Verteilung der Bevölkerung richtet sich nach anderen Prinzipien oder gar der Entfernung zu einem 2000+Gipfel, ist das ein verzerrendes Element. Da dies aber vermutlich für alle Einwohner gilt und neimand seine Entscheidung für einen Wohnort nach der Nähe zu einem Gipfel aussucht, würde ich es vernachlässigen und das bei der Interpretaion der Ergebnisse auch so angeben.

Eine sinnvolle Eingrenzung der Stichprobe könnte sein, dass du beim Statitischen Landesamt die Bevölkerungsverteilung in Bezug auf die Stadtgröße ausfindig machst und die beiden äußeren Dezile weglässt. Oder auch die beiden kleinsten und beiden größten. Oder du befragst nur das 5. und 6. Dezil. Meiner Auffassung nach wäre das repräsentativ.

Ein weiterer Hinweis wäre, dass die Stichprobe groß genug sein muss um ein repräsentatives Ergebnis zu erzeugen.

Gruß

Hallo seba11,

echt interessant. Bin mir aber nicht 100%ig sicher, ob ich
dich richtig verstehe. Versuche aber eine sinnvolle Antwort zu

da geht es dir so wie mir (ohne: „echt interessant“).
Ich versuche aber erst gar nicht, auf eine unverstandene Frage eine sinnvolle Antwort zu finden :smile:

Gruß

Gruß

hallo,
danke erstmal für die beiden antworten. Da ichs scheinbar nicht ganz geschafft habe, mein problem verständlich auszudrücken, versuch ich das nachträglich auszubessern
ich denke/hoffe zumindest das prinzip der stichprobenziehung konnte ich verständlich machen? Drum geh ich gleich zur fragestellung und zum eigentlichen problem weiter:

  1. fragestellung
    zb. wie hängt subjektive wahrnehmung von höhen und objektive feststellung von höhen zusammen? Oder
    wie hängt subjektive gefahrenwahrnehmung von wildbächen mit der amtlich festgestellten gefahrenstufe zusammen? (dh. wird subjektiv über-/unterschätzt?)

  2. das problem
    die frage soll in regelmäßig in gewissen zeitabständen geprüft werden. Dh. es werden - immer nach dem gleichen prinzip - mehrere stichproben gezogen.
    muss sich nun in beiden stichproben die verteilung der höhenlagen/gefahrenzonen innerhalb der statistischen schwankungsbreite bewegen?
    dh. in stichprobe1 lagen zb. 30 % der stichprobenadressen über 600m. Dürften sich in stichprobe2 jetzt nur 25-35 % der adressen in lagen über 600 m befinden (angenommen dies wäre die statistisch zulässige schwankungsbreite) oder können diese auch bei 10 % liegen? weil zb. in stichprobe1 eine gebirgsgroßstadt enthalten war, die in stichprobe2 - weil die ziehung auf zufall beruht - nicht vorhanden war und sich weder siedlungsgrößen, noch höhenlagen nach dem prinzip des zufalls gleichmäßig verteilen?

hoffe das problem ist diesmal etwas klarer geworden und jemand hat eine antwort/ein hinweis für mich?

lg,
sambold

ps. mir ist bewusst, dass das problem nicht direkt/vollständig mit der fragestellung zusammenhängt. Die fragestellung ist in dem sinn auch eher beispielhaft als fragestellung der studie zu lesen. Das gestellte problem resultiert aus der fragestellung, hat aber natürlich eine andere grundlage. nämlich: wie verteilen sich berge, gefahrenzonen der wildbäche, etc