Abweichung?

Hallo Zusammen!
Ich arbeite im Moment mit größeren Datensätzen die erzeugt werden. Dabei wird eine Eigenschaft X z.B. 10 mal gemessen. Die Werte sollten eigentlich alle gleich sein, sind sie aber nicht (logisch).

Nun ermittle ich den Mittelwert indem ich die Summe der 10 Messwerte durch 10 teile. Nun würde ich auch gern die Abweichung mit einfließen lassen.

Bisher habe ich diese wie folgt berechnet:

((Größter Wert der Messreihe) - (kleinster Wert der Messreihe)) : 2

Diesen Werte habe ich dann oben und unten auf meinen Mittelwert (Balkendiagramm) als Abweichung erkenntlich gemacht.

Ist diese Vorgehensweise wissentschaftlich?

Wenn nicht, wie sollte/könnte man es noch machen?

Hallo!

Falsch ist es nicht, was Du gemacht hast, aber in der Wissenschaft nicht üblich. Angenommen Du hast folgende Messwerte:

(-10, 0, 0, 0, 0, 0, 0, 0, 0, 10)

Dann würdest Du das Ergenis so darstellen: 0 ± 10. Dieselbe Darstellung würdest Du für folgende Datenreihe verwenden:

(-10, -8, -6, -4, -2, 2, 4, 6, 8, 10)

Allerdings ballen sich in der ersten Datenreihe alle Messwerte sehr eng um den Mittelwert und es gibt nur zwei Ausreißer, einen nach oben und einen nach unten, während im zweiten Beispiel die Messwerte ziemlich gleichmäßig auf den gesamten Bereich verteilt sind, und der Mittelwert tatsächlich nie gemessen wurde).

Deswegen gibt man in der Wissenschaft in der Regel nicht den maximalen Fehler an, sondern den - in Anführungszeichen - „durchschnittlichen“ Fehler. Der Fachausdruck dafür ist „Standardabweichung“.

Wenn Du Deine Daten mit Excel erfasst, gibt es dafür sogar eine Funktion: „=STABW(…)“.

Wenn wir auf eine Stelle runden, würde man die Fehler zu den beiden Datenreihen wie folgt angeben:

#1: x = 0 ± 5
#2: x = 0 ± 7

(An den Zahlenwerten kannst Du sehen, dass die Definition „durchschnittlicher Fehler“ nicht ganz sauber war. Aber die Standardabweichung ist ein ganz praktisches Maß dafür, wie weit die Messwerte streuen).

Michael

Hallo,

Michael Bauer hat Dich ja schon mit der Funktion „STABW“ bekannt gemacht. Das ist vollkommen korrekt und in der Wissenschaft ein übliches Maß, um die Größe von „Streuung“ anzugeben. Die Standardabweichung ist so beliebt, weil sie von weitverbreiteten statistischen Verfahren benutzt wird.

Die Standardabweichung ist aber eigentlich ein nicht ganz so einfach verständliches Maß für die Streuung („die Stabw. ist die Wurzel des mittleren quadratischen Abstands der Werte zum Mittelwert“ … Hmm…). Wenn man sich nicht mit dem Gedanken trägt, solche weiterführenden statistischen Analysen zu machen, gibt es Alternativen, die viel einfacher verstehbar sind.

Recht ähnlich zur Standardabweichung ist die mittlere absolute Abweichung vom Mittelwert. Sie ist genau das, was sie besagt. Diese Größe zeigt an, um welchen Betrag ein (beliebiger) Messwert vom Mittelwert im Mittel abweicht (-> „typische Abweichung“).

Zur Berechnung dieses Wertes gibt es keine Formel in Excel, aber man kann das sehr schnell ausrechnen lassen. Sagen wir, Deine Messwerte stehen in A1:A10 und der Mittelwert steht in A12. Die absoluten Abweichungen zum Mittelwert muss man für jeden Messwert berechnen. Dazu schreibt man in B1 die Formel „=ABS(A1-$A$12)“ und kopiert diese Zelle bis nach B10 runter. In B12 berechnet man dann den Mittelwert aus diesen Abweichungswerten ("=MITTELWERT(B1:B10)"). Fertig.

Eine weitere Möglichkeit besteht darin, den Interquartilsabstand als Maß für die Streuung anzugeben. Dazu muß man verstehen, was Quartile sind. Die Erklärung wird mir hier zu lang, aber du kannst dich zB. hier (http://de.wikipedia.org/wiki/Quantil) und hier (http://mlearning.dvt.fernuni-hagen.de/STAT_Kurs/STAT…), hier (http://psydok.sulb.uni-saarland.de/volltexte/2004/26…), oder hier (http://www.blikk.it/angebote/primarmathe/ma8350.htm) informieren. Die Excel-Funktion ist „QUARTILE(matrix,quartil)“. Stehen die Werte wieder in A1:A10, bekommst du den interquartilsabstand mit „=QUARTIL(A1:A10,3)-QUARTIL(A1:A10,1)“.

Vorteile beider Maße: Direkt & einfach zu interpretieren. Nachteil: Nicht geeignet für weitere statistische Analysen.

LG
Jochen

Hi Nemesis,

um noch einen draufzusetzen zu dem, was meine Vorredner schon geschrieben haben:
Standardabweichung, Interquartilsabstand und so weiter sind gute Masse, um die _Stichprobe_ zu beschreiben. Eigentlich interessiert dich aber die Genaugkeit des Mittelwertes. Um den anzugeben, müsstest du den standardfehler des Mittelwertes betarchten: http://de.wikipedia.org/wiki/Standardfehler

Mittel deine wiederholten Messungen einfliesen zu lassen sind den
Mittelwert der Messungen als einzelne Messung zu betrachten oder eine repeated mesurement analyse. Erstres ist einfacher, schätzt dir aber den Stadardfehler falsch ausserdem ist die Arbeit der 10 Messungen dann eigentlich umsonst gewesen. Die zweite ist zwar more powerful (mehr daten) ist aber klar parametrisch und damit an weitere Voraussetzungen geknüpft.

Grüße,
JPL

Super, vielen Dank für die ausführlichen Antworten!