Welche statistischen Teste wende ich an?

Hallo, ich habe für meine Abschlussarbeit 3 Altersgruppe(n=27, n=33 und n=15) für ein Führerscheingutachten untersucht. Ich will herausfinden wie viele (in Prozent) von den jeweiligen Gruppen die Teste bestanden haben. Bei einigen Daten (Sehleistung: 1,0 bzw. 100%, 0,8 bzw. 80% und 0,7 bzw. 70% / Kontrast: 1,5logCS / Verbesserung des Testergebnisses mit 0,5 oder 1,0 Dioptrien) will ich zusätzlich Mittelwert/Standardabweichung (MW/S) ermitteln.
Wann muss ich auf Normalverteilung und mit welchem Test prüfen? Mit welchen Tests bekomme ich MW und S der genannten Daten. Muss ich einen statistischen Test anwenden, wenn ich nur sagen will: In Gruppe 1 haben 67% Test 1,2.3… bestanden. In Gruppe 2 haben 53% Test 1,2,3… bestanden. In Gruppe 3 haben 45% Test 1,2,3… bestanden.
Wie man sieht, nimmt von Gruppe zu Gruppe die bestandenen Probandenzahl ab. Wenn ich nun noch herausfinden finden, ob es stimmt dass mit zunehmenden Alter mehr Probleme entstehen und daher diese öfters getestet werden sollten, welchen statistischen Test wende ich dann an?

Ich danke für hilfreiche Antworten.
LG…Tine

Hallo!

  1. Ich vermute, Sie wollen nicht nur herausfinden, wie hoch der Prozentsatz in den jeweiligen Altersgruppen Ihrer Stichprobe ist, der bestanden hat (das können Sie ja einfach ausrechnen), sondern Sie möchten wissen, ob Sie Ihre Ergebnisse auf andere Menschen dieser Altergruppen generalisieren können. Dann müssen Sie statistisch testen.

  2. Für die Tests müssen Sie wissen, was Ihre unabhängigen und Ihre abhängigen Variablen sind und wie sie gemessen werden. Das kann ich aus Ihrer Problemschilderung nicht ganz ausmachen. Sicher ist, dass die Altersgruppe eine unabhängige Variable ist. Sie messen sie als 3-stufigen Faktor (3 Gruppen). [Hier würde ich sofort fragen, warum Sie Gruppen bilden. Sie können Alter auch kontinuierlich messen. Bei der Gruppenbildung geht nämlich Information verloren.] Dann vermute ich, gibt es eine abhängige Variable: „Testergebnis“. Wie wird dies gemessen? Binär (bestanden/nicht bestanden)? Als Scoresummer (z. B. 0-100 Punkte)? Welche Rolle die Dioptrien spielen, verstehe ich nicht. Ist es bestandteil des Testergebnisses? Eine Kontrollvariable? Ohne diese Informationen fällt es mir schwer, Ihre Frage abschließend zu beantworten.

Viele Grüße

Hans-Peter

Hi,

für die Berechnung und das Berichten der Erfolgsrate musst du keinen Test verwenden, daskannst du einfach berechnen indem du #Erfolge/(n in der Gruppe) teilst.
Einen test brauchst du erst, wenn du die Aussage treffen willst, dass in einer Gruppe mehr Erfolge auftreten als in einer anderen.
Dazu bietet sich aber wegen der kleinen Fallzahlen kein test an, der auf Normalverteilung basiert. Von daher brauchst du auch nicht darauf zu testen. Und daher macht die Angabe einer SD auch keinen großen Sinn.
Besserdu verwendest ein Wilson-Score Konfidenzintervall für die Erfolgsrate und für den Test zwischen den Gruppen dasselbe nur eben für die Differenz der Raten.
Wieviele Vergleiche willst du denn machen?
Grüße,
JPL

Hallo,

du hast natürlich ein wenig das Probelm, dass deine Stichproben recht klein sind, so dass man hier nicht mit Approximationen arbeiten kann sondern wirklich eine Normalverteilung voraussetzen muss. Ich weiß jetzt nicht, wie die Größe „Dioptrin“ definiert ist, also ob es sich überhaupt um eine metrische Variable handelt. Dann sollte dir ein entsprechender Anpassungstest (vgl. ein Statistik-Buch deines Vertrauens) dir schon sagen, dass Normalverteilung vorliegt. Anonsten müsstest du halt mit Binomialverteilungen arbeiten (was eher unschön ist) oder auf verteilungsfreie Tests zurückgreifen.

Viele Grüße

Andreas

ich kann der frage nicht entnehmen ob die drei gruppen nach sehvermögen gebildet wurden oder ob diese variable von der gruppe unabhängig vorliegt (falls dies zutrifft, wie wurden die gruppen gebildet?).

www.MaSta-Support.de

Ich kann Ihnen leider z.Z. nicht helfen.

Ok, danke trotzdem für die schnelle Rückmeldung.

Ich kann Ihnen leider z.Z. nicht helfen.

Hi Michael Kobl, danke für die schnelle Rückmeldung. Hier weitere Informationen. Ich bin in Sachen Statistik leider sehr ahnungslos, deswegen schreibe ich mal alles was mir wichtig erscheint.

Ich habe mir drei Altersgruppen ausgesucht, weil in einigen Studien von einer altersabhängigen Veränderung geschrieben wird, d.h. es ist schon nachgewiesen worden dass mit steigendem Alter die Sehleistungen schlechter werden. Ich möchte nur herausfinden wie viel Personen von den jeweiligen Gruppen den Sehtest bestanden haben. Bei einigen Tests möchte ich aufzeigen, wie gut die Gruppen im Mittel bestanden haben. Kann das sein, dass die Gruppe die unabhängige Variable und der jeweilige Sehtest die abhängige Variable ist?

Gruppe 1: 18-40 Jahre
Gruppe 2: 41 bis 60 Jahre
Gruppe 3: ab 61 Jahre

Sehtest besteht aus:

  • Sehleistung: bestanden/nicht bestanden und wie viel Prozent Sehleistung im Mittel erbracht wurde (z.B. Proband 1: 1,0, Proband 2: 0,8, Proband 3: 1,0, Proband 4: 0,7 ==> Mittelwert = 0,87)
  • Farben-, Kontrast- und Stereosehen sowie Gesichtsfeld: bestanden/nicht bestanden
  • Dämmerungssehen: bestanden/nicht bestanden ==> wenn nicht bestanden: hat der Probanden diesen Test bestanden, wenn er eine Brille trägt mit 0,5/1,0/1,5 Dioptrien? (und diese Dioptrien-Werte dann auch jeweils im Mittelwert für die drei Gruppen)

Können Sie damit etwas anfangen um mir helfen zu können?

LG…Tine Mann

Ok, danke dir. Ich hätte gern das Problem mit den kleinen Stichproben umgangen, war nur leider nicht anders machbar. Ich schau mal ob ich was passendes finde. Wenn nicht, meld ich mich wieder.

Viele Grüße
Tine

hallo tine,

womit man in dieser datensituation anfangen würde ist folgendes:
man beschränkt sich auf die variablen bestanden/nicht bestanden, davon gibt es Sehleistung, Farben-, Kontrast- und Stereosehen sowie Gesichtsfeld, Dämmerungssehen. diese vergleicht man hinsichtlich den 3 altersgruppen. das resultiert in einer kreuztabelle/kontingenztafel. der entsprechende pWert liefert aufschluss darüber, ob es einen unterschied zwischen den gruppen gibt. wenn ja dann muss man die einträge in den zellen näher betrachten um die gruppenbedingte abweichung von den unter der hypothese „unabhängigkeit“ erwarteten einträgen interpretieren zu können. mittelwerte etc muss man dann methodisch anders anpacken…

schöne grüße,
www.MaSta-Support.de

Hallo JPL,

erstmal danke für deine schnelle Rückmeldung.

Wie du schon richtig erkannst hast, möchte ich nicht beweisen das mit steigendem Alter die jeweiligen Teste anders/schlechter bestanden werden. Dies wurde schon in zahlreichen Studien untersucht und eine altersabhängige Veränderung bewiesen. Ich möchte nur wissen wie viele Personen in Gruppe 1, 2 und 3 den Sehtest bestanden haben. Bei zwei Teste (Sehleistung und Dämmerungssehen) besteht die Möglichkeit noch sagen zu können, wie gut die Versuchspersonen den Test bestanden haben.

Insgesamt sind es 6 verschiedene Vergleiche:

  • Sehleistung: bestanden/nicht bestanden und wie viel Prozent Sehleistung im Mittel erbracht wurde (z.B. Proband 1: 1,0, Proband 2: 0,8, Proband 3: 1,0, Proband 4: 0,7 ==> Mittelwert = 0,87)
  • Farben-, Kontrast- und Stereosehen sowie Gesichtsfeld: bestanden/nicht bestanden
  • Dämmerungssehen: bestanden/nicht bestanden ==> wenn nicht bestanden: hat die Versuchsperson diesen Test bestanden, wenn er eine Brille trägt mit 0,5/1,0/1,5 Dioptrien? (und diese Dioptrien-Werte dann jeweils im Mittelwert für jede Gruppe)

Ich hatte vor meiner Anfrage schon mal versucht mittels STATISTICA eine Normalverteilung bei der variable Alter und Sehleistung zu berechnen. Gruppe 3 Variable Alter: p=0,866 bedeutet doch, das keine NV vorliegt, oder? Bei Sehleistung in Gruppe 1 kann ich gar keine Normalverteilung berechnen, da alle Versuchspersonen eine Sehleistung von 1,0 (in logarithmischer Form = 0,0) haben. Das Programm sagt mir das es nicht möglich sei eine NV zu berechnen.

Viele Grüße
Tine

Hallo Hans-Peter,

vielen Dank für Ihre schnelle Rückmeldung.

zu 1: Richtig, ich möchte gern mit meinen Ergebnissen die Aussage erzielen, dass diese Ergebnisse auf andere Menschen dieser Altersgruppe zutreffen. Den jeweiligen Prozentsatz der Ergebnisse hab ich auch schon berechnet.

zu 2:Ich habe 3 Altersgruppe gewählt, weil in zahlreichen Studien belegt ist, dass eine altersabhänige Veränderungen der jeweiligen Sehleistung besteht. Ich könnte demnach auch nur eine Gruppe machen und bekomme das gleiche Erbeniss? (Gruppe 1: 18-40J. / Gruppe 2: 41-60J. / Gruppe 3: ab 61J.). „Gruppe“ ist die unabhängige und der jeweilige „Sehtest“ die abhängige Variable. Die Sehteste werden jeweils in binär (bestanden/nicht bestanden) gemessen. Zusätzlich wird bei dem Test „Sehleistung“ die Angabe „Visus“ und bei dem Test „Dämmerungssehen“ die Angabe „Verbessrung des Testergebnisses mit einer Brille von 0,5/1,0/1,5 Dioptrien“ gemessen und gemittelt, d.h. als Besispiel: 78% in der Gruppe 1/2/3 haben den Test „Sehleistung“ bestanden und die Sehleistung betrug im Mittel 0,86. 67% in der Gruppe 1/2/3 haben den Test „Dämmerungssehen“ bestanden und weitere 15% haben den Test bestanden, wenn diese eine Brille mit 0,75 Dioptrien (im Mittel) tragen.

Ich hoffe ich hab alles zu Ihrer Zufriedenheit beantwortet, so dass Sie mir weiter helfen können.

Viele Grüße
Tine

Viele lieben Dank, ich werd es gleich mal in die Tat umsetzen.

Viele Grüße
Tine

Hallo Tine,

statt der Gruppenbidlung besteht die Möglichkeit, Alter als Regressor in einer Regressionsanalyse zu verwenden. Das wäre in Ihrem Fall bei der binären abhängigen Variable Test (bestanden/nicht bestanden) eine logistische Regression. Jetzt schrieben Sie in einer Ihrer anderen Antworten allerdings:

„Wie du schon richtig erkannst hast, möchte ich nicht beweisen das mit steigendem Alter die jeweiligen Teste anders/schlechter bestanden werden. Dies wurde schon in zahlreichen Studien untersucht und eine altersabhängige Veränderung bewiesen. Ich möchte nur wissen wie viele Personen in Gruppe 1, 2 und 3 den Sehtest bestanden haben.“

Also geht es Ihnen nicht um die Generalisierung Ihrer Ergebnisse auf die Population (andere Menschen verschiedenen Alters)? Dann bräuchten Sie nichts zu testen. (Allerdings verstünde ich dann den Anspruch Ihrer Studie nicht.)

Viele Grüße

Hans-Peter

Hallo Hans-Peter,

das stimmt schon, ich will nicht „wirklich“ herausfinden das Gruppe 2 schlechter als Gruppe 1 und Gruppe 3 schlechter als Gruppe 2 die Teste im einzelnen absolviert. Eher ist meine Anliegen meiner Studie, wie viele von den jeweiligen Gruppen diesen „kompletten Sehtest“ bestehen um abschließend meine Fragestellung/Hypothese beantworten zu können: Alle Führerscheinbewerber sollen sich den gleichen Testen (nicht nur den Führerschein-Sehtest) unterziehen. Alle Führerscheinbewerben müssen mit 50, 60, 65, 70 Jahren und anschließend aller 2 Jahre den „kompletten Sehtest“ wiederholen.

Kurz gesagt: Es ist statistisch nachgewiesen, dass die einzelnen Sehanforderungen (wie Sehleistung, Dämmerungssehen, Kontrastsehen und Gesichtsfeld) mit dem Alter sich verschlechtern. Aber diese werden beim Erwerb des Führerscheines nicht getestet und demnach auch nicht im höheren Alter. Es gibt viele Autofahrer (von jung bis alt) die nicht regelmäßig ihre Sehstärke bzw. Sehleistung kontrollieren lassen und somit steigt die Gefahr nicht mehr den „richtigen Überblick“ im Straßenverkehr zu haben.

Demnach sollen meine Ergebnisse „Test bestanden“ sich schon auf „alle“ Führerscheinbewerber beziehen.

Ich hoffe das bringt etwas Licht in das ganze Chaos.

Viele Grüße
Tine

Hi Tine,

also mal der Reihe nach :smile:
Danke für deine Antwort.

Ich möchte nur wissen wie viele Personen
in Gruppe 1, 2 und 3 den Sehtest bestanden haben.

Das geht recht einfach: (anzahl personen die bestanden haben) / (anzahl aller personen in der Gruppe). Dann hast du den anteil. Zu diesem kann man wie gesagt mit einem Wilson Score intervall ein Konfidenzintervall berechnen, dass einem dann den Verrauensbereich des Anteils angibt.

Bei zwei
Teste (Sehleistung und Dämmerungssehen) besteht die
Möglichkeit noch sagen zu können, wie gut die :Versuchspersonen
den Test bestanden haben.

Das ist ja eigentlich eine genauere Angabe als der Anteil der Bestandenen, insbesondere dann, wenn man nicht-bestehen als ein Ende der Skala bewerten kann. Sofern z.B. Sehleistung metrisch ist - also alle reellen Zahlen in einem Intervall annehmen kann - kann man mit dem Mittelwert schon was ausdrücken.

Insgesamt sind es 6 verschiedene Vergleiche:

  • Sehleistung: bestanden/nicht bestanden und wie viel Prozent
    Sehleistung im Mittel erbracht wurde (z.B. Proband 1: 1,0,
    Proband 2: 0,8, Proband 3: 1,0, Proband 4: 0,7 ==> Mittelwert
    = 0,87)
  • Farben-, Kontrast- und Stereosehen sowie Gesichtsfeld:
    bestanden/nicht bestanden
  • Dämmerungssehen: bestanden/nicht bestanden ==> wenn nicht
    bestanden: hat die Versuchsperson diesen Test bestanden, wenn
    er eine Brille trägt mit 0,5/1,0/1,5 Dioptrien? (und diese
    Dioptrien-Werte dann jeweils im Mittelwert für jede Gruppe)

Das ist eine Möglichkeit, die Dioptrien mit einfliessen zu lassen, interessanter wäre eigentlich die Untersuchung gewesen wie viel Dioptrien es braucht, damit die Testperson den Test besteht.
Ansonsten könnte man für jede Person 10/Dioptrien berechnen als Maß dafür, wie gut er/sie den Test bestanden hat und 0, falls gar nicht.

Ich hatte vor meiner Anfrage schon mal versucht mittels
STATISTICA eine Normalverteilung bei der variable Alter und
Sehleistung zu berechnen. Gruppe 3 Variable Alter: p=0,866
bedeutet doch, das keine NV vorliegt, oder?

Nein, genau das Gegenteil. Aber um NV würde ich mir weniger Gedanken machen. Es gibt genug Möglichkeiten eine Analyse zu machen ohne NV zu brauchen.

Bei Sehleistung in
Gruppe 1 kann ich gar keine Normalverteilung berechnen, da
alle Versuchspersonen eine Sehleistung von 1,0 (in
logarithmischer Form = 0,0) haben. Das Programm sagt mir das
es nicht möglich sei eine NV zu berechnen.

Was ja auf der Hand liegt :smile: Jeder stat. Test braucht ein Streuungsmaß und wenn die Werte alle gleich sind, also nicht streuen, gibt’s das nicht, also funktioniert der Test nicht.

Grüße,
JPL

Hallo Tine,
als erster Impuls ist mir einer logistische Regression als Analysemöglichkeit eingefallen.

Fragegestellung:
Welche Einflussfaktoren haben wie stark zum Bestehen der Prüfung beigetragen.

Abhängige Variable:

  • Bestehen der Prüfung (0=nein, 1=ja)

Unabhängige Variablen:

  • Altersgruppe (polynomialer Kontrast)
  • Sehleistung
  • etc.

Eine logistische Regression ist in SPSS relativ leicht umzusetzen (Menüpunkt Analysieren - Regression - binär logistisch). Zentrales Maß der logistischen Regression ist das Odds-Ratio (im SPSS-Jargon: „exp(b)“). Einen einführenden Text dazu findest Du hier:
Rumpf, H.-J. (2010). Was ist ein Odds Ratio? Psychotherapie, Psychosomatik und medizinische Psychologie, 60, 190–191.

Ich hoffe, ich konnte helfen,
Kutya