Hallo,
die Frage steht bereits im Titel. Die Standardabweichung ist ja die Streuung um den Mittelwert. Aber wieso macht sie bei wenig Werten keinen Sinn? Und wie viele Werte sollte man haben, damit diese etwas aussagt?
danke!
Hallo,
die Frage steht bereits im Titel. Die Standardabweichung ist ja die Streuung um den Mittelwert. Aber wieso macht sie bei wenig Werten keinen Sinn? Und wie viele Werte sollte man haben, damit diese etwas aussagt?
danke!
Moin,
Aber wieso macht sie bei
wenig Werten keinen Sinn?
weil diese Werte unsicher sind.
Und wie viele Werte sollte man
haben, damit diese etwas aussagt?
Das kann man pauschal nicht sagen, es hängt auch davon ab, wie aufwendig es ist, diese Werte zu gewinnen.
Theoretisch (wenn auch mit großer Unsicherheit) kann man ab zwei Werten arbeiten.
In der Chemischen Analytik z.B. wenn das Verfahren hinreichend bekannt und sicher ist, wird auch schon mal mit drei Werten Statistik betrieben.
Andere Verfahren brauchen weit größere Datenzahlen.
Gandalf
hi,
gegenfrage: ab wie vielen werten macht statistik an sich sinn?
antwort: je viel desto gut.
formell: mittelwerte als lagegrößen machen an sich ab einem wert sinn. der mittelwert von 1 ist 1. der mittelwert von 1 und 3 ist 2. usw.
standardabweichungen machen an sich erst ab 2 messwerten sinn, denn bei einem messwertkann es keine abweichung geben. deswegen wird bei stichproben auch durch n-1 dividiert, nicht durch n.
aber: je viel desto gut.
m.
Hi,
aber: je viel desto gut.
Prinzipiell richtig, aber wie Gandalf schon sagt, gibt es auch Bereiche, in denen mit wenigen Werten gearbeitet werden kann.
Ein wesentlicher Unterschied, ob eine Auswertung weniger Daten schon Sinn macht oder nicht, liegt daran, ob Abweichungen nur durch Messfehler entstehen (chemische Analytik) oder ob schon die untersuchten Daten selbst eine inhärente Abweichung haben.
Ein Beispiel: Bei der quantitativen Analyse einer chemischen Reaktion sollten(!) Abweichungen nur durch Messfehler entstehen. Hier reichen dann auch wenige Daten, die hoffentlich sowieso in einem geringen Bereich streuen.
Genau anders herum ist es bei der durchschnittlichen Lebenserwartung. Hier haben wir eine sehr genau Messmethode - allerdings streuen die erfassten Werte selbst sehr stark (Menschen leben nun mal sehr unterschiedlich lange, aus den verschiedensten Gründen). Hier aus nur 3, 5 oder sogar 10 Werten (was in der chemischen Analytik normale Zahlen sein können) einen Mittelwert zu ziehen, ist natürlich Unsinn.
Gruß
Anwar
Hm. Ich frage mich ob es Regeln dafür gibt.
Du sagst ja damit nichts anderes als dass die Anzahl der benötigten Stichproben für eine Aussage abhängig von der Halbwertsbreite ist. Das wäre mir ehrlich gesagt neu.
Wobei das schon deswegen problematisch ist, weil die Alterskurve ja nicht symmetrisch ist und man sich daher eh fragen muss ob man hier überhaupt mit Mittelwerten und Standardabweichungen hantieren darf (ich denke mal nein).
Hi,
standardabweichungen machen an sich erst ab 2 messwerten sinn,
denn bei einem messwertkann es keine abweichung geben.
Doch. Der ist schlicht 0 (=keine Streuung).
deswegen wird bei stichproben auch durch n-1 dividiert, nicht
durch n.
Der Grund ist ein anderer: Effizienz der Schätzung der SD.
Viele Grüße,
JPL
Hallo,
Hm. Ich frage mich ob es Regeln dafür gibt.
Der ganz große Statistik-Experte bin ich auch nicht.
Du sagst ja damit nichts anderes als dass die Anzahl der
benötigten Stichproben für eine Aussage abhängig von der
Halbwertsbreite ist. Das wäre mir ehrlich gesagt neu.
Das scheint mir nur logisch - je größer die Halbwertsbreite, desto geringer ist doch die Konfidenz bei gegebener Stichprobengröße, oder?
Wobei das schon deswegen problematisch ist, weil die
Alterskurve ja nicht symmetrisch ist und man sich daher eh
fragen muss ob man hier überhaupt mit Mittelwerten und
Standardabweichungen hantieren darf (ich denke mal nein).
Gut, das war jetzt vielleicht kein perfektes Beispiel (Körpergröße wäre evt. besser, ich glaube, die ist annähernd normalverteilt).
Wobei ich durchaus denke, dass man auch bei asymmetrischer Werteverteilung einen Mittelwert bilden darf. Nur Standardabweichung ist dann natürlich nicht mehr definiert.
Gruß
Anwar
Hi,
Du sagst ja damit nichts anderes als dass die Anzahl der
benötigten Stichproben für eine Aussage abhängig von der
Halbwertsbreite ist. Das wäre mir ehrlich gesagt neu.Das scheint mir nur logisch - je größer die Halbwertsbreite,
desto geringer ist doch die Konfidenz bei gegebener
Stichprobengröße, oder?
das stimtm aber nur, wenn du die Breite/Weiter des Konfis festlegst. ansonsten wird das Konfi einfach nur breiter bei gleichem Konfidenzniveau. Unter dem Aspekt ist größere Halbwertstbreite nur ein Ausdruck von größerer Streuung.
Wobei das schon deswegen problematisch ist, weil die
Alterskurve ja nicht symmetrisch ist und man sich daher eh
fragen muss ob man hier überhaupt mit Mittelwerten und
Standardabweichungen hantieren darf (ich denke mal nein).Gut, das war jetzt vielleicht kein perfektes Beispiel
(Körpergröße wäre evt. besser, ich glaube, die ist annähernd
normalverteilt).
aber nur innerhalb eines Geschlechts
Wobei ich durchaus denke, dass man auch bei asymmetrischer
Werteverteilung einen Mittelwert bilden darf. Nur
Standardabweichung ist dann natürlich nicht mehr definiert.
Doch, es ist weiterhin alles definiert. Aber bei multimodalen / schiefen / asymmetrischen Verteilungen ist es eben leider nicht mehr so, dass man sie mit mean&SD beschreiben kann (wie es bei der Normalverteilung der Fall ist). Lognormalverteilung ist der Klassiker in der Beziehung.
viele Grüße,
JPL