Statischtische Auswertung Fragebogen

Hallo Zusammen,

ich hoffe jemand von euch kann mir weiter helfen. Folgender Sachverhalt:
Ich mache eine Usability Studie wo auch ein Fragebogen eingesetzt wird. Dabei sind Fragen wie:
Wie alt sind sie?
(1) 45 Jahre

oder auch Wie gut schätzen Sie Ihre Computer-und Softwarekenntnisse ein?
(1)sehr schlecht
(2)schlecht
(3)eher schlecht
(4)neutral
(5)eher gut
(6)gut
(7)sehr gut

Nun habe ich die Antworten so kodiert wie auch in den Fragen steht. Z.B. Frage 1, Antwort 1
So dass ich eine Tabelle wie folgt habe (Benutzer-B):
F1 F2 F3 F4
B1 1 2 1 5
B2 2 3 1 1
B3 6 1 5 4
B4 1 1 1 1

  1. Frage: sollte ich die so überhaupt kodieren?

Da ich den Zusammenhang zwischen den einzelnen Antworten z. B. je älter ein Benutzer desto geringer sind seine Computerkenntnisse, heraus finden möchte, habe ich die Rangkorrelation nach Spearman für jedes Wertepaar berechnet. Da diese aber ja eine Rangbindung aufweisen, dies auch bei der Berechnung beachtet.

  1. Frage: Stimmt das überhaupt was ich gemacht habe? Hätte nicht einfach eine Korrelation nach Pearson gereicht?
    Ich bin etwas verwirrt. :smile:

Ich berechne die Daten in Excel, also etwas aufwändiger wie sonst.

Vielen Dank für eure Antworte.
Gruß Angie

hi,

Ich mache eine Usability Studie wo auch ein Fragebogen
eingesetzt wird. Dabei sind Fragen wie:
Wie alt sind sie?
(1) 45 Jahre

oder auch Wie gut schätzen Sie Ihre Computer-und
Softwarekenntnisse ein?
(1)sehr schlecht
(2)schlecht
(3)eher schlecht
(4)neutral
(5)eher gut
(6)gut
(7)sehr gut

das sind beides ordinalskalen. es hat also z.b. keinen wirklich statistischen sinn, so was wie mittelwerte und varianzen zu berechnen (was theoretisch möglich ist, wenn du in zahlen kodierst).

Nun habe ich die Antworten so kodiert wie auch in den Fragen
steht. Z.B. Frage 1, Antwort 1
So dass ich eine Tabelle wie folgt habe (Benutzer-B):
F1 F2 F3 F4
B1 1 2 1 5
B2 2 3 1 1
B3 6 1 5 4
B4 1 1 1 1

  1. Frage: sollte ich die so überhaupt kodieren?

schwer zu sagen; ich versteh auch nicht wirklich, was du da machst. du erwähnst oben 2 fragen, hast unten pro fragebogen 4 codierungen. sehe ich das richtig, dass du im beispiel codierungen von antworten auf 4 fragen hast?
also benutzer B1 ist z.b. unter 24, hat „schlechte“ computerkenntnisse und gibt auf die fragen 3 und 4 (die wir nicht kennen) antworten der kategorie 1 bzw. 5.
ist das so?

Da ich den Zusammenhang zwischen den einzelnen Antworten z. B.
je älter ein Benutzer desto geringer sind seine
Computerkenntnisse, heraus finden möchte, habe ich die
Rangkorrelation nach Spearman für jedes Wertepaar berechnet.
Da diese aber ja eine Rangbindung aufweisen, dies auch bei der
Berechnung beachtet.

im prinzip von der idee her korrekt. spearmans rangkorrelation geht an sich davon aus, dass die ordinalskalen gleichen abstand zwischen den kategorien haben. das ist m.e. nicht unbedingt der fall. (ist der „abstand“ zwischen „neutral“ und „eher gut“ der gleiche wie der zwischen „gut“ und „sehr gut“? ich weiß nicht; kann man schlecht begründen.
eine alternative wäre kendalls tau.

  1. Frage: Stimmt das überhaupt was ich gemacht habe? Hätte
    nicht einfach eine Korrelation nach Pearson gereicht?

defintiv nicht. die korrelation geht von intervalldaten (metrischen daten) aus. deine daten haben dieses niveau nicht.

m.

Hi Michael,

schwer zu sagen; ich versteh auch nicht wirklich, was du da
machst. du erwähnst oben 2 fragen, hast unten pro fragebogen 4
codierungen. sehe ich das richtig, dass du im beispiel
codierungen von antworten auf 4 fragen hast?
also benutzer B1 ist z.b. unter 24, hat „schlechte“
computerkenntnisse und gibt auf die fragen 3 und 4 (die wir
nicht kennen) antworten der kategorie 1 bzw. 5.
ist das so?

Ja genau, das soll nur ein Auszug der Fragen sein, insgesamt sind es 15 Fragen.

im prinzip von der idee her korrekt. spearmans rangkorrelation
geht an sich davon aus, dass die ordinalskalen gleichen
abstand zwischen den kategorien haben. das ist m.e. nicht
unbedingt der fall. (ist der „abstand“ zwischen „neutral“ und
„eher gut“ der gleiche wie der zwischen „gut“ und „sehr gut“?
ich weiß nicht; kann man schlecht begründen.
eine alternative wäre kendalls tau.

Müsste mich dann hier auch einarbeiten :smiley:

  1. Frage: Stimmt das überhaupt was ich gemacht habe? Hätte
    nicht einfach eine Korrelation nach Pearson gereicht?

defintiv nicht. die korrelation geht von intervalldaten
(metrischen daten) aus. deine daten haben dieses niveau nicht.

m.

Super, jetzt weiß ich, dass ich auf den richtigen Weg bin. Danke

Bevor ich mit der Aufgabe weiter machen ist mir folgendes aufgefallen:

Ist es ok wenn ich unterschiedlich „skalierte“ (weiß nicht wie man das nennt)Fragen habe, also:

Frage 1: Wie alt sind sie?
(1) 45 Jahre

Frage 2: Sind Hilfsmittel zur Nutzung der Software erforderlich?

(1) Nein
(2) Ja

Frage 3: Wie gut schätzen Sie Ihre Computer- und Softwarekenntnisse ein? ( 1 = sehr schlecht; 7 = sehr gut)

(1) 1
(2) 2
(3) 3
(4) 4
(5) 5
(6) 6
(7) 7

Frage 4: Wie häufig nutzen Sie die Software durchschnittlich?

(1) mehrmals täglich
(2) 1 mal pro Tag
(3) 1 mal pro Woche
(4) 1 mal pro Monat
(5) Nie

und die Korrelationsanalyse durchführe? d.h. z. B. Frage 2 könnte nur die Werte 1 oder 2 annehmen, dafür aber Frage 3 die Werte 1 - 7 und Frage 4 die Werte 1-5.

Viele Grüße und Danke

hi,

Bevor ich mit der Aufgabe weiter machen ist mir folgendes
aufgefallen:

Ist es ok wenn ich unterschiedlich „skalierte“ (weiß nicht wie
man das nennt)Fragen habe, also:

ja, das nennt man so. man spricht auch von verschiedenen „datenniveaus“ (nominal, ordinal, metrisch/intervall).
nominale daten haben nur verschiedene klassen (alternativen), aber keine ordnung. ordinale daten sind klar linear geordnet, metrische daten haben klare abstände. mit ihnen kann man richtig „rechnen“.

körpergröße ist metrisch, körpergewicht ist metrisch.
schulnoten sind ordinal.

Frage 1: Wie alt sind sie?
(1) 45 Jahre

ordinal

Frage 2: Sind Hilfsmittel zur Nutzung der Software
erforderlich?

(1) Nein
(2) Ja

nominal / alternativ

Frage 3: Wie gut schätzen Sie Ihre Computer- und
Softwarekenntnisse ein? ( 1 = sehr schlecht; 7 = sehr gut)

(1) 1
(2) 2
(3) 3
(4) 4
(5) 5
(6) 6
(7) 7

ordinal

Frage 4: Wie häufig nutzen Sie die Software durchschnittlich?

(1) mehrmals täglich
(2) 1 mal pro Tag
(3) 1 mal pro Woche
(4) 1 mal pro Monat
(5) Nie

ordinal

und die Korrelationsanalyse durchführe? d.h. z. B. Frage 2
könnte nur die Werte 1 oder 2 annehmen, dafür aber Frage 3 die
Werte 1 - 7 und Frage 4 die Werte 1-5.

ja, es ist üblich, möglich und korrekt, verschiedene datenniveaus zu haben.
spearmans rangkorrelation setzt aber z.b. ordinale daten voraus, geht also nicht zwischen frage 2 und den anderen fragen.

m.