Auswertung eines Fragebogens, Statistik

Ich hab für eine wissenschaftliche Arbeit, die ich verfassen muss, einen Fragebogen online gehabt, der sich mit Fragen zum Thema Internet und soziale Beziehungen befasst. Ich habe u.a. die Teilnehmer gefragt, wie viele Stunden sie etwa pro Woche im Internet verbringen und sie anhand dieser Werte in 3 Gruppen (Viel-, Normal- und Wenignutzer eingeteilt). Dann habe ich sie gefragt, wie viele Freunde sie haben, die sie real kennengelernt haben, und wieviele Online-Freunde sie haben. Ich möchte beweisen, dass bei den Vielnutzern im Vergleich zu den Wenignutzern die Zahl der Offline-Freunde abnimmt, während die Zahl der Online-Freunde zunimmt.

Das Problem ist jetzt folgendes: Ich bin keine Statistikerin, ich komme mit z-Test, t-Test, Signifikanztest und was es sonst noch so gibt nicht zurecht. Tatsache ist, ich habe Mittelwerte ausgerechnet und tatsächlich haben die Vielnutzer einen geringeren Mittelwert bei den Offline-Freunden und einen höheren bei den Online-Freunden.

Wie kann ich jetzt beweisen, dass die Ergebnisse statistisch signifikant sind? Welchen Test muss ich nehmen und wie funktioniert der?

Für Hilfe wäre ich sehr, sehr dankbar!

Hallo erstmal

Ich hab für eine wissenschaftliche Arbeit, die ich :verfassen muss, einen Fragebogen online gehabt, der :sich mit :Fragen zum
Thema Internet und soziale Beziehungen befasst.

…gehabt oder ist dieser immer noch online ?

Ich habe u.a. die Teilnehmer gefragt, wie viele Stunden :sie etwa pro Woche
im Internet verbringen und sie anhand dieser Werte in 3
Gruppen (Viel-, Normal- und Wenignutzer eingeteilt).

Klingt gut :smile:

Dann habe
ich sie gefragt, wie viele Freunde sie haben, die sie :real
kennengelernt haben, und wieviele Online-Freunde sie :haben.
Ich möchte beweisen(*), dass bei den Vielnutzern im

(*)Mit Statistiken beweist man nichts. Aber man kann eine aufgestellte Hypothese annehmen oder ablehnen.

Vergleich zu
den Wenignutzern die Zahl der Offline-Freunde abnimmt, :während
die Zahl der Online-Freunde zunimmt.

Das Problem ist jetzt folgendes: Ich bin keine :Statistikerin,
ich komme mit z-Test, t-Test, Signifikanztest und was :es sonst
noch so gibt nicht zurecht. Tatsache ist, ich habe :Mittelwerte
ausgerechnet und tatsächlich haben die Vielnutzer einen
geringeren Mittelwert bei den Offline-Freunden und :einen
höheren bei den Online-Freunden.

Der Mittelwert allein wird nicht reichen. Man braucht noch die Varianz (zumindest sollte man sich darauf mental vorbereiten :wink: )

Wie kann ich jetzt beweisen, dass die Ergebnisse :statistisch
signifikant sind? Welchen Test muss ich nehmen und wie
funktioniert der?

Erstmal eine Seite zum Thema Statistik: http://www.reiter1.com/Glossar/Glossar.htm (suche nach Mittelwert)
Es gibt übrigens je nach den Voraussetzungen und den Gegebenheiten (gleiche/ungleiche, geschätzte/bekannte Varianzen, Daten normalverteilt,… ) mehrere Testmöglichkeiten: Regression, ANOVA,…

HTH
mfg M.L.

(*)Mit Statistiken beweist man nichts. Aber man kann eine
aufgestellte Hypothese annehmen oder ablehnen.

Ja so war’s auch gemeint. Meine Hypothese lautet, dass bei erhöhter Internetnutzung die Zahl der Offline-Freunde sinkt usw.

Der Mittelwert allein wird nicht reichen. Man braucht noch die
Varianz (zumindest sollte man sich darauf mental vorbereiten
:wink: )

Ich hab auf dem Link nachgelesen, und dann auch mal die Varianz ausgerechnet… Leider sagt mir das nichts. Ich habe für die Offline-Freunde insgesamt einen Wert von ~28 herausbekommen, wenn ich richtig gerechnet habe. Was sagt dieser Wert aus?

Erstmal eine Seite zum Thema Statistik:
http://www.reiter1.com/Glossar/Glossar.htm (suche nach
Mittelwert)
Es gibt übrigens je nach den Voraussetzungen und den
Gegebenheiten (gleiche/ungleiche, geschätzte/bekannte
Varianzen, Daten normalverteilt,… ) mehrere
Testmöglichkeiten: Regression, ANOVA,…

Ich habe wie gesagt mir die Ausführungen zum Mittelwert durchgelesen auf der Seite, auch die Ausführungen über ANOVA, t-Test etc. Ich werde nicht wirklich schlau daraus (bin absoluter Laie auf dem Gebiet der Statistik)…

Hallo nochmal.

Ich habe
für die Offline-Freunde insgesamt einen Wert von :~28
herausbekommen, wenn ich richtig gerechnet habe. :Was sagt
dieser Wert aus?

Für sich alleine noch gar nichts.

Aber es wird wohl besser sein, die Ergebnisse der Umfrage hier zu posten. Zumindest kann man sich dann ein besseres Bild von der (Daten)Lage machen :wink:
Am besten noch mit Erklärung, welcher Wert woher kommt

mfg M.L.

Hallo nochmal.
Für sich alleine noch gar nichts.

Aber es wird wohl besser sein, die Ergebnisse der Umfrage hier
zu posten. Zumindest kann man sich dann ein besseres Bild von
der (Daten)Lage machen :wink:
Am besten noch mit Erklärung, welcher Wert woher kommt

mfg M.L.

Ok, klar. Vorab, ich bin wie gesagt keine Statistikerin, kann sein, dass das eine sehr naive Herangehensweise ist, aber ich wusste mir nicht besser zu helfen.

Also, in der Umfrage wurde einfach gefragt „Wie viele gute (Offline-)Freunde hast du?“, die Teilnehmer konnten dann eine Zahl selber eingeben. Insgesamt haben 84 Leute den Fragebogen gültig ausgefüllt, also N = 84.

Ich habe für alle einen Mittelwert errechnet (eingegebene Zahlen alle zusammengezählt und durch 84 dividiert), da kam raus: 5,65. Heißt also für mich, durchschnittlich hat ein Teilnehmer zwischen 5 und 6 Offline-Freunden.

Wie gesagt hab ich dann die Teilnehmer noch in die 3 Gruppen Viel-, Normal- und Wenignutzer aufgeteilt. Um meine Hypothese zu bestätigen will ich die Wenig- und die Vielnutzer betrachten.

Der Mittelwert für die Vielnutzer (13 Teilnehmer) ergibt 3,77 (ausgerechnet wieder über die Summe der Ergebnisse aller Vielnutzer dividiert durch 13). Für die Wenignutzer ergibt das ganze 6,46.

Das klingt ja eigentlich ganz gut, weil’s augenscheinlich ja n relativ großer Unterschied is. Aber ich weiß jetz eben leider nicht, wie ich wissenschaftlich beweise, dass dieser Unterschied statistisch signifikant ist.

Okay, das waren mal die wichtigsten Ergebnisse.

Danke schonmal für die Hilfe!

Guten Abend.

Also, in der Umfrage wurde einfach gefragt „Wie viele gute
(Offline-)Freunde hast du?“, die Teilnehmer konnten dann eine
Zahl selber eingeben. Insgesamt haben 84 Leute den Fragebogen
gültig ausgefüllt, also N = 84.

N1(Gruppe Vielnutzer) = 13
N2(Gruppe Normalnutzer) = ?
N3(Gruppe Wenignutzer) = ?
N1+N2+N3 = 84

Ich habe für alle einen Mittelwert errechnet (eingegebene
Zahlen alle zusammengezählt und durch 84 dividiert), da kam
raus: 5,65. Heißt also für mich, durchschnittlich hat ein
Teilnehmer zwischen 5 und 6 Offline-Freunden.

Stimmt.

Wie gesagt hab ich dann die Teilnehmer noch in die 3 Gruppen
Viel-, Normal- und Wenignutzer aufgeteilt. Um meine Hypothese
zu bestätigen will ich die Wenig- und die Vielnutzer
betrachten.

Der Mittelwert für die Vielnutzer (13 Teilnehmer) ergibt 3,77
(ausgerechnet wieder über die Summe der Ergebnisse aller
Vielnutzer dividiert durch 13). Für die Wenignutzer ergibt das
ganze 6,46.

Das klingt ja eigentlich ganz gut, weil’s augenscheinlich ja n
relativ großer Unterschied is. Aber ich weiß jetz eben leider
nicht, wie ich wissenschaftlich beweise, dass dieser
Unterschied statistisch signifikant ist.

Da die Varianzen geschätzt werdem müssen und die Mittelwerte zweier (nicht mehr dreier) Stichproben verglichen werden sollen, wird hier der doppelte t-Test angewendet: http://www.reiter1.com/Glossar/Glossar_detailliert_I…
(Variante des Welch-Tests)

HTH
mfg M.L.

Guten Abend.
N1(Gruppe Vielnutzer) = 13
N2(Gruppe Normalnutzer) = ?
N3(Gruppe Wenignutzer) = ?
N1+N2+N3 = 84

Ah, entschuldigung.
N = 84
Vielnutzer = 13
Normalnutzer = 47
Wenignutzer = 24

Da die Varianzen geschätzt werdem müssen und die Mittelwerte
zweier (nicht mehr dreier) Stichproben verglichen werden
sollen, wird hier der doppelte t-Test angewendet:
http://www.reiter1.com/Glossar/Glossar_detailliert_I…
(Variante des Welch-Tests)

Das is vielleicht ne blöde Frage, aber warum müssen die Varianzen geschätzt werden? In dem Glossar und auch in einem Buch das ich dazu hab steht doch, wie man die ausrechnen kann, mit dieser
(Wert1 - Mittelwert)² + (Wert2 - Mittelwert)²… / Mittelwert
Formel, oder? Müsste sich das bei mir nicht auch konkret ausrechnen lassen? Ich hab noch nicht genau verstanden, wozu Varianzen gut sind, aber man könnte doch z.B. für die Vielnutzer diese Formel verwenden jeweils mit Wert1 bis Wert13 und als Mittelwert den Mittelwert für die Vielnutzer nehmen und dann hätte man ne Varianz, oder?

Hallo zum 4.Mal

N = 84
Vielnutzer = 13
Normalnutzer = 47
Wenignutzer = 24

Da die Varianzen geschätzt werdem müssen und die :Mittelwerte
zweier (nicht mehr dreier) Stichproben verglichen :werden
sollen, wird hier der doppelte t-Test angewendet:
http://www.reiter1.com/Glossar/Glossar_detailliert_I…
(Variante des Welch-Tests)

Das is vielleicht ne blöde Frage, aber warum müssen die
Varianzen geschätzt werden? In dem Glossar und auch in :einem
Buch das ich dazu hab steht doch, wie man die :ausrechnen kann,
mit dieser
(Wert1 - Mittelwert)² + (Wert2 - Mittelwert)²… / :Mittelwert

…nicht ‚/ Anzahl Einheiten‘ ?

Formel, oder? Müsste sich das bei mir nicht auch :konkret ausrechnen lassen?

Was die Formel für die Schätzung darstellt :wink:

Ich hab noch nicht genau verstanden, wozu
Varianzen gut sind, aber man könnte doch z.B. für die
Vielnutzer diese Formel verwenden jeweils mit Wert1 bis :Wert13
und als Mittelwert den Mittelwert für die Vielnutzer :nehmen
und dann hätte man ne Varianz, oder?

Ähm…ja (obwohl die Formulierung beim ersten Lesen etwas konfus klang :smiley: ).
Aaaalso: die Mittelwerte und Varianzen der drei Gruppen
werden separat errechnet. Formeln sind ja bekannt, nur die Werte für Gruppengrössen, Mittelwerte & Varianzen sind immer unterschiedlich. Je zwei dieser Ergebnisse werden in die Formel des WELCH-Tests eingesetzt und auf Signifikanz überprüft. Und um alle drei Gruppen zu vergleichen würde man die ANOVA verwenden.

Rechnen muss man allerdings jetzt selbst :wink:

Hoffentlich bringt das jetzt Licht ins Dunkel.
mfg M.L.

*g* also erstmal vielen Dank für die Hilfe. Eine Frage hätte ich noch. Und zwar finde ich unterschiedliche Varianten für die Formel des Welch-Test… in dem Glossar steht sie
(mittelwert1 - mittelwert2)/ wurzel((s1/n1)²+(s2/n2)²)

Auf einigen Internet seiten is die Formel ähnlich, allerdings so:
(mittelwert1 - mittelwert2)/ wurzel(s1²/n1 + s2²/n2)

was heißt, dass bei der oberen variante n1 und n2 ja auch quadriert werden, bei der unteren variante nicht… das müsste mathematisch gesehen dann ja einen unterschied machen… welche Formel ist richtig?

Und noch was: wenn ich dann ein Ergebnis t bekomme, was sagt das dann aus bzw. was mach ich damit?

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo zum 5.Mal

Und zwar finde ich unterschiedliche Varianten für
die Formel des Welch-Test… in dem Glossar steht sie
(mittelwert1 - mittelwert2)/ wurzel((s1/n1)²+(s2/n2)²)

t-Test bei untersch. Varianzen

Auf einigen Internet seiten is die Formel ähnlich, allerdings
so:
(mittelwert1 - mittelwert2)/ wurzel(s1²/n1 + s2²/n2)

Quellen ? Wenn hier nicht gerade eine andere Variante zum Zug kommt, kann hier ebenso ein Schreibfehler vorliegen. Im Zweifel ist das Glossar massgebend.

Und noch was: wenn ich dann ein Ergebnis t bekomme, was :sagt
das dann aus bzw. was mach ich damit?

Das ist eine sog. ‚Prüfgrösse‘: diese wird mit einem tabellierten Wert unter Beachtung des Signifikanzniveaus und den Freiheitsgraden verglichen. Wenn die PG

Das ist eine sog. ‚Prüfgrösse‘: diese wird mit einem
tabellierten Wert unter Beachtung des Signifikanzniveaus und
den Freiheitsgraden verglichen. Wenn die PG

Hallo Chi!

Wenn du mir deine Daten schickst, werde ich sie für dich auswerten und Ergebnisse und Vorgehen nachvollziehbar erklären.

Gruß
Falk

Hallo zum 6.Mal

Okay also ich hab versucht, das nach den Formeln zu rechnen
und bekomme dann raus
t = 2,81
f = 24,38
Wie ich das gerechnet habe, hab ich mal hier konkret
dokumentiert:
http://www.amaterasu.at/zeugs/test.html
Ist das richtig so? Sind das die richtigen Formeln? Dass ich
richtig gerechnet habe, davon gehe ich schon aus, aber ich bin
mir nich so ganz sicher ob ich jeweils die richtigen Formeln
habe.

Sieht richtig aus :smile:

Wenn ich sage, ich nehme als Signifikanzniveau 95% …
was ist mit einem tabellierten Wert gemeint? Wo kann ich sowas
nachschlagen?

Damit ist eine Tabelle der t-Verteilung gemeint. Man schaut an der Stelle alpha=0.95 und f=24,38 nach. Vielleicht diese: http://www.faes.de/Basis/Basis-Statistik/Basis-Stati…
Aaaalso: man nimmt 95% und f.d. FG die Werte 24 + 25. Ergibt 2,064 + 2,060. Diese Werte sind kleiner als die PG. Damit kann die Hypothese, dass beide Stichproben denselben Mittelwert besitzen, mit einer 5% Irrtumswahrscheinlichkeit verworfen werden.
…vorausgesetzt, es wurde die richtige Tabelle verwendet :smiley:
Einen Fall wie f=24,38 hatte der Autor dieser Zeilen bisher noch nicht.

HTH
mfg M.L.

Hallo zum 6.Mal

Okay also ich hab versucht, das nach den Formeln zu rechnen
und bekomme dann raus
t = 2,81
f = 24,38
Wie ich das gerechnet habe, hab ich mal hier konkret
dokumentiert:
http://www.amaterasu.at/zeugs/test.html
Ist das richtig so? Sind das die richtigen Formeln? Dass ich
richtig gerechnet habe, davon gehe ich schon aus, aber ich bin
mir nich so ganz sicher ob ich jeweils die richtigen Formeln
habe.

Sieht richtig aus :smile:

Wenn ich sage, ich nehme als Signifikanzniveau 95% …
was ist mit einem tabellierten Wert gemeint? Wo kann ich sowas
nachschlagen?

Damit ist eine Tabelle der t-Verteilung gemeint. Man schaut an
der Stelle alpha=0.95 und f=24,38 nach. Vielleicht diese:
http://www.faes.de/Basis/Basis-Statistik/Basis-Stati…
Aaaalso: man nimmt 95% und f.d. FG die Werte 24 + 25. Ergibt
2,064 + 2,060. Diese Werte sind kleiner als die PG. Damit kann
die Hypothese, dass beide Stichproben denselben Mittelwert
besitzen, mit einer 5% Irrtumswahrscheinlichkeit verworfen
werden.
…vorausgesetzt, es wurde die richtige Tabelle verwendet :smiley:
Einen Fall wie f=24,38 hatte der Autor dieser Zeilen bisher
noch nicht.

Vielen, vielen Dank für die Hilfe!!
Das „damit kann die Hypothese, dass beide Stichproben denselben Mittelwert besitzen, mit einer 5% Irrtumswahrscheinlichkeit verworfen werden“ wäre in dem Fall dann die Nullhypothese, richtig? Heißt, ich habe bewiesen dass die Nullhypothese zu 95% falsch ist und damit meine Hypothese… öh… richtig?

Hallo zum x-ten Mal

(übrigens ein persönlicher Rekord: normalerweise schreibt der Autor dieser Zeilen derart, dass ein Thread mit max. 3 Postings seinerseits beglückt wird :smiley:)

Vielen, vielen Dank für die Hilfe!!

Bitte.

Das „damit kann die Hypothese, dass beide Stichproben
denselben Mittelwert besitzen, mit einer 5%
Irrtumswahrscheinlichkeit verworfen werden“ wäre in dem Fall
dann die Nullhypothese, richtig?

H0: Mittelwerte sind gleich
H1: Mittelwerte sind nicht gleich
Oder formelmässig:
H0: nü1 = nü2
H1: nü1 != nü2

Heißt, ich habe bewiesen dass

…mit Statistik beweist man _nichts_ !

die Nullhypothese zu 95% falsch ist und damit meine
Hypothese… öh… richtig?

Die Hypothese H1 kann mit 95%-iger I.t.w. nicht abgelehnt werden -> Die Hypothese H0 kann mit 5%-iger Irrtumswahrscheinlichkeit abgelehnt werden
Soll heissen: es gibt nach wie vor keine Sicherheit. Das einzig Sichere ist die Unsicherheit :wink:

HTH
mfg M.L.