Durchschnittsbildung bei Standardabweichung?

Guten Tag,
ist es erlaubt die Durchschnittliche Standardabweichung einer Expertenbefragung zu ermittlen?

Frage 1, (Exp1, Exp2, Exp3), Standarabweichung_f1
Frage 2, (Exp1, Exp2, Exp3), Standarabweichung_f2
Frage 3, (Exp1, Exp2, Exp3), Standarabweichung_f3

Durchschnittsbildung der Standardabweichungen von allen Fragen erlaubt? Sinnvoll?

hi,

Frage 1, (Exp1, Exp2, Exp3), Standarabweichung_f1
Frage 2, (Exp1, Exp2, Exp3), Standarabweichung_f2
Frage 3, (Exp1, Exp2, Exp3), Standarabweichung_f3

tut mir leid, ich versteh das nicht. erklär bitte genauer, was du da tust / getan hast:
was antworten die experten? in welcher form antworten sie? welche berechnung einer „standardabweichung“ liegt vor?

m.

n Experten beantworten i Fragen. Bei der Beantwortung der i Fragen haben sie die Möglichkeit eine Wahrscheinlichkeit zwischen P=0,5 und 1,0 als Antwort zu nennen (in 0,05 er Schritten). Die Standardabweichung lässt sich pro Frage über die Antworten der Experten ermitteln. Ist die Durchschnittsbildung aller Standardabweichungen über allen Fragen sinnvoll? Wäre so etwas wie minimale und maximale Std-Abweichung pro Frage nicht sinnvoller?

Ist die
Durchschnittsbildung aller Standardabweichungen über allen
Fragen sinnvoll? Wäre so etwas wie minimale und maximale
Std-Abweichung pro Frage nicht sinnvoller?

Ich denke, beides ist wenig sinnvoll. Was soll denn die Interpretation dieser Größe sein? Das ist mir nicht klar.

Wenn Du aber trotzdem die Information zur Streuung über die Fragen mitteln willst, dann gibt es zwei Möglichkeiten:

  1. Da dir alle Daten vorliegen, kannst Du die Standardabweichung für alle Daten gemeinsam ausrechnen.

  2. Varianzen kann man „poolen“. Also berechne den Mittelwert der Varianzen und ziehe daraus wieder die Wurzel. Dann erhälst Du eine gepoolte Standardabweichung (ich gehe davon aus, dass jede Frage von der gleichen Anzahl an Experten beantwortet wurde).

Wie gesagt, mir ist die Bedeutung(!) weder der einen noch der anderen Größe klar! Sie würden einen Sinn ergeben, wenn sich die Fragen nicht unterscheiden würden oder eine zufällige Stichprobe aus einer „Population möglicher, gleichartiger Fragen“ darstellen. Beides ist sicher nicht der Fall, und damit verliert sich die Sinnhaftigkeit solcher „Mittelwerte“.

LG
Jochen

Hallo Jochen,

vielen Dank für Deine Antwort. Das Ziel ist es, ein Maß für die gesamte Befragung zu entwickeln, welches den Grad der Übereinstimmung der Experten untereinander, repräsentiert.

Dazu habe ich noch die folgende Idee: In einer vorherigen Frage, hatte ich ja nach einer Möglichkeit gefragt den Konsens unter Experten statistisch auszudrücken.

Im Buch (Google-Books-Link: http://books.google.de/books?id=paP0Zhs96HUC&pg=PA54… auf Seite 54) wurde angenommen, dass bei einer 10-Stufigen Skala der Konsens über die Standardabweichung

hi,

Im Buch (Google-Books-Link:
http://books.google.de/books?id=paP0Zhs96HUC&pg=PA54…
auf Seite 54) wurde angenommen, dass bei einer 10-Stufigen
Skala der Konsens über die Standardabweichung

Bedeutet dies, dass ich auf der Intervallskala P[0,5;1] keine Standardabweichung berechnen darf? Wenn nein, welches Maß wäre besser? Wenn ich sie dennoch berechnen dürfte und ich mit der in der Literatur getroffenen Annahme argumentiere, ist das doch einigermaßen schlüssig, oder?

Bedeutet dies, dass ich auf der Intervallskala P[0,5;1] keine
Standardabweichung berechnen darf? Wenn nein, welches Maß wäre
besser? Wenn ich sie dennoch berechnen dürfte und ich mit der
in der Literatur getroffenen Annahme argumentiere, ist das
doch einigermaßen schlüssig, oder?

mein gott: tausende menschen berechnen fortwährend durchschnittsnoten, obwohl das als mittelwerte auf einer ordinalskala statistischer unsinn ist.

mach, was du willst, und signalisiere problembewusstsein.

m.

Bedeutet dies, dass ich auf der Intervallskala P[0,5;1] keine
Standardabweichung berechnen darf? Wenn nein, welches Maß wäre
besser? Wenn ich sie dennoch berechnen dürfte und ich mit der
in der Literatur getroffenen Annahme argumentiere, ist das
doch einigermaßen schlüssig, oder?

mein gott: tausende menschen berechnen fortwährend
durchschnittsnoten, obwohl das als mittelwerte auf einer
ordinalskala statistischer unsinn ist.

Okay, das ist ja bekannt. Aber nicht unbedingt ein Grund es genauso zu machen. Vor allem wenn man an einer interdisziplinären Arbeit dran ist und sich (auch in den Bereichen in denen man weniger bewandert ist) Mühe geben möchte.

mach, was du willst, und signalisiere problembewusstsein.

Das mache ich ja (s.o.) :smile: Wäre es dann besser das Intervall nicht in 0,05er Schritte zu unterteilen und somit keine Ordinalskala mehr zu haben? D.h. freie Wahl der Wahrscheinlichkeit zwischen 0,5 und 1?

Trotzdem vielen Dank für Deine Antwort.

m.

Hi,

wenn ich gerade noch mal einhaken darf:

Das Ziel ist es, ein Maß für
die gesamte Befragung zu entwickeln, welches den Grad der
Übereinstimmung der Experten untereinander, repräsentiert.
Dazu habe ich noch die folgende Idee: …

Dazu brauchst du keine (eigene) Idee.
„Urteilerübereinstimmung“ heisst das und kann z.B. via Kappa-Koeffizient berechnet/getestet werden, z.B. http://www.rbsd.de/PDF/DMW/DMW-2007-S1-23.pdf.
Grüße,
JPL

Bedeutet dies, dass ich auf der Intervallskala P[0,5;1] keine
Standardabweichung berechnen darf? Wenn nein, welches Maß wäre
besser? Wenn ich sie dennoch berechnen dürfte und ich mit der
in der Literatur getroffenen Annahme argumentiere, ist das
doch einigermaßen schlüssig, oder?

mein gott: tausende menschen berechnen fortwährend
durchschnittsnoten, obwohl das als mittelwerte auf einer
ordinalskala statistischer unsinn ist.

Okay, das ist ja bekannt. Aber nicht unbedingt ein Grund es
genauso zu machen. Vor allem wenn man an einer
interdisziplinären Arbeit dran ist und sich (auch in den
Bereichen in denen man weniger bewandert ist) Mühe geben
möchte.

wenn du’s statistisch seriös haben willst, dann lös dich vom gedanken, dass eine stufenskala zwischen 0,5 und 1 eine intervallskala ist (sondern eine ordinalskala), dass man dort guten gewissens mittelwerte und standardabweichungen berechnen kann (sondern mediane und perzentile auszählen).

m.