Standardabweichung + Ausreißer

Hallo,

ich habe aus 10 Messwerten eine Standardabweichung ermittelt und soll nun schauen ob zwei Messwerte Ausreißer sind.

Also ich hätte jetzt die Abweichung mal 2 genommen und ± auf den Mittelwert gerechnet und dann geguckt ob die Messwerte im Rahmen liegen.

Wäre das so richtig?

Viele Grüße

Also ich hätte jetzt die Abweichung mal 2 genommen und ± auf
den Mittelwert gerechnet und dann geguckt ob die Messwerte im
Rahmen liegen.

Wenn man es richtig machen will, wird es schon etwas komplizierter. Siehe z.B.

http://de.wikipedia.org/wiki/Ausreißertest_nach_Grubbs

Hi,

Wenn man es richtig machen will, wird es schon etwas
komplizierter. Siehe z.B.
http://de.wikipedia.org/wiki/Ausreißertest_nach_Grubbs

Hmm, also wenn man richtig machen will, dann schaut man sich an, ob die Werte unphysiologisch, unlogisch, ausserhalb der Skala sind , das Gerät nicht kalibriert oder verstellt war etc. und nicht bloß, was ein stat. Test einem vorschreibt.
Je nach Messskala können gerade extreme Werte auf die tatsächliche Verteilung hinweisen.
Und eigentlich will man ja falsche Werte identifizieren. Die müssen aber nicht zwangsläufig besonders groß oder klein sein. Wenn bspw in einer Standard-Verdünnungsreihe 1,3,6,9,12 herauskommen sollte aber man 1.1, 2.8, 5.4, 6.2 und 11.7 misst, dann sind kaum 1.1 oder 11.7 die falschen Werte.

Viele Grüße,
JPL

Hmm, also wenn man richtig machen will, dann schaut man sich
an, ob die Werte unphysiologisch, unlogisch

Definiere „unphysiologisch“ und „unlogisch“.

ausserhalb der
Skala sind , das Gerät nicht kalibriert oder verstellt war
etc. und nicht bloß, was ein stat. Test einem vorschreibt.

Wenn man das bereits weiß, verwirft man die Werte, bevor man mit der Verarbeitung der Daten beginnt. Die Frage, ob es sich um Ausreißer handelt, ist in solchen Fällen uninteressant. Wenn man es nicht weiß, dann muss man erst einmal erkennen, dass es da ein Problem gegeben haben könnte und damit ist man wieder bei der Statistik.

Siehe auch: http://de.wikipedia.org/wiki/Ausreißer

Hi,

Hmm, also wenn man richtig machen will, dann schaut man sich
an, ob die Werte unphysiologisch, unlogisch

Definiere „unphysiologisch“ und „unlogisch“.

Blutverlust von 9L, FEV1 > 5L, neg.kalium-gehalt, denk dir was aus.

ausserhalb der
Skala sind , das Gerät nicht kalibriert oder verstellt war
etc. und nicht bloß, was ein stat. Test einem vorschreibt.

Wenn man das bereits weiß, verwirft man die Werte, bevor man
mit der Verarbeitung der Daten beginnt.

Wenn das so wäre, wäre es ja schön. Viele bemühen aber erst den Test und überlegen sich dann (wenn überhaupt), was da schief gelaufen sein könnte oder sie wissen es zwar, denken aber dass sie es nur mit einem stat. Test herausfinden können, dass es wirklich schief gelaufen ist.

Oder sie wenden den Test an, um einen schöneren KS-Anpassungstest zu bekommen. Oder weil man es eben einfach so macht/schon immer so gemacht hat.

Die Frage, ob es sich
um Ausreißer handelt, ist in solchen Fällen uninteressant.
Wenn man es nicht weiß, dann muss man erst einmal erkennen,
dass es da ein Problem gegeben haben könnte und damit ist man
wieder bei der Statistik.

Die Frage ist da eben nur, was man da eigentlich erkennt.

Betrachte mal x=(0.326, 0.514, 0.0596, 1.704, 3.048, 1.037, 1.552, 0.673, 1.387, 16.0462)
16.0462 ist natürlich auch ein Ausreißer, Grubbs schemist den auch brav weg mit alpha = 2.5%.
Dabei liegt dem Ganzen einfach nur eine LogN Verteilung zugrunde.

Grüße,
JPL

Definiere „unphysiologisch“ und „unlogisch“.

Blutverlust von 9L, FEV1 > 5L, neg.kalium-gehalt, denk dir was
aus.

Diese Beispiele zeigen das Problem: Solche Definitionen sind jeweils nur für ein spezifisches Problem gültig. Wenn die Frage unter Angabe von Herkunft und Bedeutung der Daten in einem naturwissenschaftlichen Brett gestellt worden wäre, könnte man sinnvoll darüber diskutieren, aber das ist hier nicht der Fall. Ohne entsprechende Hintergrundinformationen lassen sich solche Ausschlusskriterien nicht objektiv formulieren. Und die Frage erweckt auch nicht den Anschein, dass sowas erwartet wird.

Betrachte mal x=(0.326, 0.514, 0.0596, 1.704, 3.048, 1.037,
1.552, 0.673, 1.387, 16.0462)
16.0462 ist natürlich auch ein Ausreißer, Grubbs schemist den
auch brav weg mit alpha = 2.5%.
Dabei liegt dem Ganzen einfach nur eine LogN Verteilung
zugrunde.

Das Problem ist hier nicht der Ausreißertest, sondern die Annahme einer falschen Verteilung. Wenn man die Verteilung kennt, darf man Grubbs nicht verwenden und wenn man sie nicht kennt, kann man die Daten gar nicht vernünftig auswerten. Für eine empirische Bestimmung der Verteilung reichen die Werte jedenfalls nicht aus. Das gilt natürlich auch für Frage von Wurstebrei.

1 Like

Hi,

Diese Beispiele zeigen das Problem: Solche Definitionen sind
jeweils nur für ein spezifisches Problem gültig. Wenn die
Frage unter Angabe von Herkunft und Bedeutung der Daten in
einem naturwissenschaftlichen Brett gestellt worden wäre,
könnte man sinnvoll darüber diskutieren, aber das ist hier
nicht der Fall. Ohne entsprechende Hintergrundinformationen
lassen sich solche Ausschlusskriterien nicht objektiv
formulieren. Und die Frage erweckt auch nicht den Anschein,
dass sowas erwartet wird.

Und eben deswegen wundertes mich, dass du ohne Nachfragen einen Test vorschlägst, anstatt tatsächlich darauf hinzuweisen, was den die Fragestellung ist, der Hintergrund und so weiter.

Betrachte mal x=(0.326, 0.514, 0.0596, 1.704, 3.048, 1.037,
1.552, 0.673, 1.387, 16.0462)
16.0462 ist natürlich auch ein Ausreißer, Grubbs schemist den
auch brav weg mit alpha = 2.5%.
Dabei liegt dem Ganzen einfach nur eine LogN Verteilung
zugrunde.

Das Problem ist hier nicht der Ausreißertest, sondern die
Annahme einer falschen Verteilung.

Nicht unbedingt:
set.seed(35); x=rnorm(n=10); (max(x)-mean(x))/sd(x)
Das ist sogar zu alpha=1% signifikant.

Wenn man die Verteilung
kennt, darf man Grubbs nicht verwenden und wenn man sie nicht
kennt, kann man die Daten gar nicht vernünftig auswerten. Für
eine empirische Bestimmung der Verteilung reichen die Werte
jedenfalls nicht aus. Das gilt natürlich auch für Frage von
Wurstebrei.

Wobei man von einer Bestimmung der Verteilung eigentlich gar nicht reden kann, weil nur nach einer Nichtablehnung eines Tests bezgl einer bestimmten Verteilung gesucht wird.

Anyway, ich hätte erwartet, dass die von dir genannten Voraussetzungen vorab geklärt werden. Leider machen aber eben die meisten einen Test ohne irgendwelche Gedanken daran zu verschwenden (warum auch immer, das ist ja keinesfalls immer böse Absicht) was sie sich damit einbrocken.

Grüße,
JPL

Hallo,

melde mich mal ganz kurz.
In letzter Zeit können im Forum Fragen mit minimalen Vorgaben maximale Reaktionen auslösen.

Der Fragesteller Wurstebrei ist schon länger dabei, aber er äußert sich nicht

  • ist eine Hausaufgabe oder eine echte Messreihe
  • welche Vorkenntnisse sind vorhanden
  • wie tief will er einsteigen
  • hat eine falsche Antwort eine schlechte Zensur oder ein schlechtes Medikament zur Folge ?

Momentan kann die Antwort nur lauten: Ausreißer > 3*sigma.

Ansonsten liegt die Ergebnis-Spanne ungefähr dazwischen
http://www.statistics4u.info/fundstat_germ/cc_outlie…
ftp://ftp.geoinfo.tuwien.ac.at/navratil/Ausgleich1.pdf
(S.196)
oder bei den o.g. Links.

Schönen Abend
Roland

Hi Roland,

Momentan kann die Antwort nur lauten: Ausreißer > 3*sigma.

eben das finde ich nicht. Statt dessen sollte die Antwort lauten:

  • ist es eine Hausaufgabe oder eine echte Messreihe?
  • welche Vorkenntnisse sind vorhanden?
  • wie tief will er einsteigen? (Oder eher „muss“)
  • hat eine falsche Antwort eine schlechte Zensur oder ein
    schlechtes Medikament zur Folge ? (letztes wohl eher nicht, da man sich in der Branche hauseigener oder zugekaufter number-cruncher bedient :wink:)

Grüße,
JPL

Hey,

sorry hat etwas gedauert… Also es handelt sich um eine Übungsaufgabe.

Und ich meine das mit dem 3 * Sigma ist richtig, kann mich wage daran erinnern und wir machen es nicht ganz sooo genau.

Vielen Dank an dieser Stelle (an alle natürlich!! )

Was ich mcih noch frage ist, auf was ich die 3fache Standardabweichung beziehe?! Auf den Mittelwert?

Viele Grüße

Hallo,

Kurzfassung: ja, auf den Mittelwert.
Langfassung: Ausreißertests gehörten mal zu meiner Ausbildung, aber dann nicht mehr zu meiner Praxis. Hängen blieb, dass beim Test meist von einem Ausreißer ausgegangen wird, bei zweien oder mehr wird’s sehr theoretisch, auch was die Standardabweichung und den Mittelwert betrifft.
Bei zwei vermuteten unter zehn Messwerten - in der Kaffeerunde am Freitag war die Meinung: vergessen, neu messen. Alles Akademische kann nicht die mangelnde Sorgfalt der Messung ersetzen. (Wenn es allerdings kaum zu wiederholende Messungen , wie z.B. Fallmessungen in Bremen wären … )

Wenn es eine Übungsaufgabe ist, ist vorrangig zu beachten, was ihr vorher geübt habt und was der Übungsleiter mutmaßlich erwartet …

Grüße Roland