Unterstützung Interpretation Regressionsanalyse

Hallo zusammen,

derzeit sitze ich an der Auswertung einer Befragung und komme nicht so wirklich voran.

Meine These: Die Teilnahme an Schulungsmaßnahmen führt zu einer Reduzierung der Belastung am Arbeitsplatz.

Gemessen wurde die Anzahl der Schulungstage. Die Ermittlung der Belastung erfolgte durch eine Liiert-Skala der entsprechende Punkte hinterlegt wurden.

Mein erster Ansatz ist die Auswertung des Streudiagramms mit entsprechender Regressionsanalyse.

Auswertung Regressionsanalyse:

y = -1,1123x + 63,792
R2 = 0,04458
r = -0,211
Signifikanz = 0,003

Meine Interpretation:
Es besteht ein geringer linearer Zusammenhang zwischen der Anzahl der Schulungstage und der Höhe der Belastung. Das geringe Bestimmtheitsmaß zeigt jedoch auf, das es andere Störgrößen gibt, die den Hauptteil der Belastung hervorrufen. (Ist in meinen Augen auch logisch). Dennoch würde ich die Nullhypothese auf Grundlage der vorliegenden verwerfen und die aufgestellte These als verifiziert ansehen, Ist dies so richtig, oder begehe ich dabei einen Fehler. Habe ich evtl. etwas wichtiges vergessen oder übersehen ?

Mein zweiter Ansatzpunkt ist der Mittelwertsvergleich der Belastung zwischen den Teilnehmern und den Nichtteilnehmern, also ohne Berücksichtigung der Anzahl der Schulungstage.
Mein Vorgehen:

  1. Shapiro-Wilk-Test auf Normalverteilung der beiden Stichproben ( Signifikanz 0,920 = normalverteilt)
  2. Levene-Test auf Varianzhomogenität (Signifikanz 0,556 = gleiche Varianzen)
  3. T-Test: T-Wert: - 3,030 Signifikanz = 0,003

Interpretiere ich diesen Test richtig, wenn ich sage, das die Belastung der Teilnehmer im Mittel um -3,030 Punkte weniger ist, als bei den Teilnehmern ?

Da ich ein Laie auf diesem Gebiet bin, freue ich mich über jede erdenkbare Unterstützung.

Vielen Dank.

Hi,

Gemessen wurde die Anzahl der Schulungstage. Die Ermittlung
der Belastung erfolgte durch eine Liiert-Skala der
entsprechende Punkte hinterlegt wurden.

wie ist denn der range der Skala?

Mein erster Ansatz ist die Auswertung des Streudiagramms mit
entsprechender Regressionsanalyse.

d.h. du hattest x=schulungstage und y=Belastung?

Auswertung Regressionsanalyse:

y = -1,1123x + 63,792
R2 = 0,04458
r = -0,211
Signifikanz = 0,003

Das sieht nicht nach einem besonders guten fit aus.
Eher nach einer Punktwolke im wahrsten Sinne des Wortes und einer recht beliebigen leicht abfallenden Linie mitten durch

Meine Interpretation:
Es besteht ein geringer linearer Zusammenhang zwischen der
Anzahl der Schulungstage und der Höhe der Belastung. Das
geringe Bestimmtheitsmaß zeigt jedoch auf, das es andere
Störgrößen gibt, die den Hauptteil der Belastung hervorrufen.
(Ist in meinen Augen auch logisch). Dennoch würde ich die
Nullhypothese auf Grundlage der vorliegenden verwerfen und die
aufgestellte These als verifiziert ansehen,

Kommt drauf an worauf sich die signifikanz bezieht. Meistens auf das R² und es wird getestet ob es verschieden von 0 ist.Gut das wäre hier der Fall, aber der Zusammenhang ist ja doch sehr schwach.

Mein zweiter Ansatzpunkt ist der Mittelwertsvergleich der
Belastung zwischen den Teilnehmern und den Nichtteilnehmern,
also ohne Berücksichtigung der Anzahl der Schulungstage.
Mein Vorgehen:

  1. Shapiro-Wilk-Test auf Normalverteilung der beiden
    Stichproben ( Signifikanz 0,920 = normalverteilt)
  2. Levene-Test auf Varianzhomogenität (Signifikanz 0,556 =
    gleiche Varianzen)
  3. T-Test: T-Wert: - 3,030 Signifikanz = 0,003

Interpretiere ich diesen Test richtig, wenn ich sage, das die
Belastung der Teilnehmer im Mittel um -3,030 Punkte weniger
ist, als bei den nichtTeilnehmern ?

ja, als dass sie signifikant kleiner ist (und das auch nur, wenn der Vergleich richtig herum war, also Teilnehmer - nichtTeilnehmer), nein was den betrag angeht. Der t-wert ist nicht der mittlere unterschied sondern die test-statistik (=mittelwert / Streuung)

Grüße,
JPL