Standardabweichung bei negativen Werten

Guten Morgen,

ich komme bei einem statistischen Problem nicht weiter. Vorneweg: ich bin hier absoluter Laie…

Ich habe 30 Messpunkte mit unterschiedlichen Durchmessern, die jetzt mit einem anderen System vermessen wurden. Die Abweichung zwischen wahrem Wert und gemessenem Wert soll nun statistisch angegeben werden um das andere System zu bewerten.
Da quasi jeder Punkt seinen eigenen Sollwert hat, habe ich zuerst die Differenz von Messwert und Sollwert gebildet, um die Abstände vergleichbar zu machen. Nun ist ja der theoretisch perfekte Mittelwert gleich 0 und ich habe positive und negative Abweichungen.
Jetzt weiß ich aber nicht, ob ich für die Standardabweichung die Differenzwerte oder den Betrag der Differenzwerte nehmen muss.

Ich hoffe, mir kann da jemand weiterhelfen. Oder sagen, ob das ganze so überhaupt sinnvoll ist…

Gruß

hi,

Ich habe 30 Messpunkte mit unterschiedlichen Durchmessern, die
jetzt mit einem anderen System vermessen wurden. Die
Abweichung zwischen wahrem Wert und gemessenem Wert soll nun
statistisch angegeben werden um das andere System zu bewerten.

es geht also drum, die beiden messverfahren vergleichend zu bewerten. stimmt das?

Da quasi jeder Punkt seinen eigenen Sollwert hat, habe ich
zuerst die Differenz von Messwert und Sollwert gebildet, um
die Abstände vergleichbar zu machen. Nun ist ja der
theoretisch perfekte Mittelwert gleich 0 und ich habe positive
und negative Abweichungen.

ist der sollwert ein istwert? d.h.: willst du die beiden messverfahren mit der realität vergleichen (wie immer die ermittelt wurde) oder miteinander?

Jetzt weiß ich aber nicht, ob ich für die Standardabweichung
die Differenzwerte oder den Betrag der Differenzwerte nehmen
muss.

Ich hoffe, mir kann da jemand weiterhelfen. Oder sagen, ob das
ganze so überhaupt sinnvoll ist…

bewegen sich die messwerte (bzw. sollwerte / istwerte) alle in etwa in der gleichen dimension? oder sind z.b. einige werte im mm-bereich und andere im km-bereich? im einen fall ist ein messunterschied von 2 mm riesengroß, im anderen fall praktisch gleich 0.

sind die messwerte als stichprobe zu betrachten oder als gesamtpopulation? d.h.: sind deine 30 messpunkte alle oder nur eine auswahl einer u.u. viel größeren menge?

ein beispiel anhand einer tabellenkalkulation:

Mp. Real Mess1 Mess2 Diff1 Diff2
1 5 4,9 5,1 -0,1 0,1
2 6 5,8 6,1 -0,2 0,1
3 7 7,1 7,1 0,1 0,1
4 8 7,9 8,1 -0,1 0,1
5 9 9,2 8,9 0,2 -0,1

 Mittelwert: -0,02 0,06
 Standardabweichung: 0,1470 0,08

im obigen beispiel gehe ich davon aus, dass 2 messserien (mess1, mess2) mit einer realität verglichen werden sollen. es geht um 5 messpunkte (mp.), die keine stichprobe, sondern eine gesamtpopulation bilden. die daten liegen alle im gleichen maßstab.
man bildet die differenzen zwischen messserie und realität (diff1 und diff2) und dazu mittelwerte und standardabweichungen (funktionen MITTELWERT() und STABWN().
die mittelwerte zeigen, dass die erste methode tendenziell eher zu wenig misst, die zweite tendenziell eher zu viel. näher an der realität ist die erste, obwohl sie etwas mehr streut. über „signifikanz“ will ich da nix sagen; das würde mehr diskussion erfordern.

wären die messserien stichproben, wäre die richtige funktion für die standardabweichung übrigens STABW() (ohne N) und die zahlen wären etwas höher.

hth
m.

Puh, schon mal danke für umfangreiche Antwort.

Zu deinen Fragen:

  • Das erste Messverfahren ist hinreichend genau, um es hier mal als Ist-Wert zu gelten. Auch wenn eine Messung natürlich nie den echten Wert wiedergibt… Also soll das andere Messverfahren mit den realen Werten verglichen werden und nicht mit dem ersten Verfahren.
  • Es handelt sich um Werte der gleichen Dimension, also sind keine großen Ausreißer dabei.
  • Es handelt sich um eine Stichprobe, die entsprechende Funktion habe ich auch gewählt.

Mein Problem liegt eher bei der „0“. Wenn ich doch nach der Differenzbildung positive und negative Werte habe, heben die sich ja schon bei der Mittelwertbildung nahezu auf. Der Mittelwert bildet dann ja nicht mehr die durchschnittliche Abweichung ab. Daher habe ich hier schon mal die Beträge der Differenzen genommen. Aber was tun bei der Standardabweichung…?

Hi pedroforlan,

Da quasi jeder Punkt seinen eigenen Sollwert hat, habe ich
zuerst die Differenz von Messwert und Sollwert gebildet, um
die Abstände vergleichbar zu machen. Nun ist ja der
theoretisch perfekte Mittelwert gleich 0 und ich habe positive
und negative Abweichungen.
Jetzt weiß ich aber nicht, ob ich für die Standardabweichung
die Differenzwerte oder den Betrag der Differenzwerte nehmen
muss.

Allgemein ist der Abstand positiv, also dem Betrag gleichzusetzen, allderings verliert man dann den Bezug zur Richtung. Ausserdem verändert man die Verteilung der variablen erheblich.
Wenn du dir Beträge verwendest, ist zwar der perfekte Mittelwert immer noch 0, aber der Erwartungswert des Betrages ist nicht 0.
Demgegenüber ist bei der Verwendung der negativen und positiven Werte der erwartete Mittelwert auch 0, d.h. die schätzung sollte in disem Fall besser sein.

Grüße,
JPL

hi,

Mein Problem liegt eher bei der „0“. Wenn ich doch nach der
Differenzbildung positive und negative Werte habe, heben die
sich ja schon bei der Mittelwertbildung nahezu auf. Der
Mittelwert bildet dann ja nicht mehr die durchschnittliche
Abweichung ab. Daher habe ich hier schon mal die Beträge der
Differenzen genommen. Aber was tun bei der
Standardabweichung…?

wenn der mittelwert über die (gerichteten) differenzen 0 ist, haben die messverfahren das gleiche mittel. je größer der betrag dieses mittelwerts ist, desto mehr weichen die messungen voneinander ab. der mittelwert ist ein maß für die „zentrale lage“ des messverfahrens. (liegst dur „drunter“ oder „drüber“ oder i.w. „drauf“?)

die standardabweichung ist ein maß für die streuung des jeweiligen messverfahrens, für seine genauigkeit / reliabilität. rechnest du die standardabweichung der beträge (alle positiv), reduzierst du die festgestellte / feststellbare streuung, ohne dass ich eine berechtigung dafür sehe.

die standardabweichung ist eine zahl. ich weiß nicht, was du mit dieser zahl anfangen kannst. wenn du 2 standardabweichungen für 2 messverfahren hast (wie in meinem beispiel), kannst du sagen, welches verfahren mehr oder weniger streut. wenn du nur eine zahl hast, sagt dir die praktisch nix darüber, ob das „viel“ oder „wenig“ streuung ist.

hth
m.

die standardabweichung ist ein maß für die streuung des
jeweiligen messverfahrens, für seine genauigkeit /
reliabilität. rechnest du die standardabweichung der beträge
(alle positiv), reduzierst du die festgestellte /
feststellbare streuung, ohne dass ich eine berechtigung dafür
sehe.

die standardabweichung ist eine zahl. ich weiß nicht, was du
mit dieser zahl anfangen kannst. wenn du 2
standardabweichungen für 2 messverfahren hast (wie in meinem
beispiel), kannst du sagen, welches verfahren mehr oder
weniger streut. wenn du nur eine zahl hast, sagt dir die
praktisch nix darüber, ob das „viel“ oder „wenig“ streuung
ist.

hth
m.

Eine Normalverteilung vorrausgesetzt sagt mir die Standardabweichung doch, dass ca. zwei Drittel meiner Werte im Abstand von einer Standardabweichung vom Mittelwert liegen. Somit hätte ich doch eine absolute Aussage.
Und da ich bestimmte Vorgaben habe, die das andere Verfahren in Bezug auf die Messqualität haben muss, ist diese Zahl schon entscheidend.
Sagen wir mal, ich habe einen maximal erlaubten Abstand von 3 und mehr als 99% der gemessenen Werte sollen darunter liegen, dann dürfte die Standardabweichung ja maximal 1 sein.
Wenn ich jetzt zwei verschiedene Standardabweichungen berechnen kann, dann wirds haarig. Obwohl meine Werte wohl nicht normalverteilt sind…

Aber du empfiehlst mir, auf den Betrag zu verzichten? Ein Ja oder Nein würde mir da schon reichen…

Danke!

Hi JPL,

auf die Richtung könnte ich verzichten, die ist nicht so entscheidend. Von Interesse ist der Abstand zum reellen Wert.

Ich möchte quasi, dass die Standardabweichung um ein mehrfaches kleiner ist als der maximal erlaubte Abstand, so dass ich sagen kann nahezu alle Messwerte liegen im Rahmen.
Wobei ich jetzt keine Ahnung habe, wie es sich mit der Verteilung verhält, wenn meine Werte schon nicht normalverteilt sind…

Aber du sagst auch, ich sollte auf die Beträge verzichten?

Gruß

hi,

Eine Normalverteilung vorrausgesetzt sagt mir die
Standardabweichung doch, dass ca. zwei Drittel meiner Werte im
Abstand von einer Standardabweichung vom Mittelwert liegen.
Somit hätte ich doch eine absolute Aussage.

okay. mit dieser voraussetzung …

Und da ich bestimmte Vorgaben habe, die das andere Verfahren
in Bezug auf die Messqualität haben muss, ist diese Zahl schon
entscheidend.
Sagen wir mal, ich habe einen maximal erlaubten Abstand von 3
und mehr als 99% der gemessenen Werte sollen darunter liegen,
dann dürfte die Standardabweichung ja maximal 1 sein.
Wenn ich jetzt zwei verschiedene Standardabweichungen
berechnen kann, dann wirds haarig. Obwohl meine Werte wohl
nicht normalverteilt sind…

Aber du empfiehlst mir, auf den Betrag zu verzichten? Ein Ja
oder Nein würde mir da schon reichen…

Ja.

m.

Aber du empfiehlst mir, auf den Betrag zu verzichten? Ein Ja
oder Nein würde mir da schon reichen…

Ja.

m.

Ok, vielen Dank!

Hallo,

kennst Du denn die Verteilung? Sie ist nicht die Normalverteilung, ok, aber vielleicht ist die Verteilung ja bekannt oder aber sie ist zwar unbekannt, kann aber durch eine geeignete Transformation in eine Normalverteilung transformiert werden.

In all diesen Fällen wäre es dann möglich, ein sogenanntes Konfidenzintervall (KI) für die Messwerte zu berechnen. Das 99%-KI zB. gibt die den Bereich, in dem 99% der Werte liegen werden. Ich denke, das ist doch genau das, was Du willst, oder?

LG
Jochen

Hi pedroforlan,

auf die Richtung könnte ich verzichten, die ist nicht so
entscheidend. Von Interesse ist der Abstand zum reellen Wert.

Dann wird es halt ein wenig kniffelig. schau mal hier: http://quality.kenline.de/seiten_d/spc_verteilungen.htm da gibt es auch ein nettes Bild zur Betragsverteilung

Ich möchte quasi, dass die Standardabweichung um ein
mehrfaches kleiner ist als der maximal erlaubte Abstand, so
dass ich sagen kann nahezu alle Messwerte liegen im Rahmen.
-) Dann musst du nur oft genug messen und hoffen, dass das Gerät im Mittel keine abweichung hat. wie ist denn der maximale abstand angegeben? Als Betrag?

Das Problem ist folgendes:
Wenn du z.B. die Messwerte hast
x = (-3, -2, -1, 0,0,0, 1 3, 4,)
dann hast du die Betragswerte:
y = |x| = 0,0,0,1,1,2,3,3,4
dann ist der mean(x) = 0.22222 und mean(|x|)=1.55556, der Wert ist logischerweise deutlich höher.
Während bei annahme einer Normalverteilung der Erwartungswert des Gerätes gut über den Mittelwert geschätzt werden kann, während das bei der Betragsverteilung nicht der Fall sein muss (ich habe aber auf die Schnelle keine Methoden zur Parameterschätzung gefunden, also ist das eine ungesicherte Hypothese). so kannst du zwar den mean auch für den Betrag verwenden, aber evtl. schätzt du damit gar nicht das, was du wissen willst.
Spätestens, wenn du daran gehen gehen willst und die Güte deines Gerätes angeben willst, kommst du um ein Konfidenzintervall nicht mehr drum herum. Dieses basiert auf sog. Quantilen, die von deiner Verteilung abhängig sind. Für die Normalverteilung ist das easdy, für die Betragsverteilung …
Klar kann man auch nichtparametrische Konfidenzintervalle angeben, dann ersparst du dir die Verteilungsüberprüfung.

Wobei ich jetzt keine Ahnung habe, wie es sich mit der
Verteilung verhält, wenn meine Werte schon nicht
normalverteilt sind…

-> http://www.dr-hernla.de/t-messun.pdf
-> http://home.arcor.de/michael_keinz/AS_Teil1_neu.DOC

Aber du sagst auch, ich sollte auf die Beträge verzichten?

Ja, denn wenn dein Gerät nicht nur absolute Werte angibt würde ich es lassen: da es sich bei dem Betrag um keine sog. ‚monotone Transformation‘ handelt (wenn x