Beweisen, dass es keine Korrelation gibt (Nullhypothese)

Hallo Leute,

Ich brauche dringend Hilfe für eine statistische Überprüfung, die ich gerade durchführe. Vorab: Ich bin leider kein Experte in Statistik und lerne auch gerade erst, wie das alles funktioniert (inklusive R).

In einem linguistischen Paper, das ich gerade schreibe, versuche ich zu zeigen, dass es zwischen einer Reihe von Kategorien (in meinem Fall: „H“, „M“, „L“) und kontinuierlichen Werten (in meinem Fall: gemessenen Tonhöhen in Hz) keine Korrelation gibt. Konkret: für eine bestimmte Sprache wird beschrieben, das gewisse Silben Töne tragen, ich gehe aber davon aus, dass sie dies nicht tun. Ich habe dazu Aufnahmen und Messungen durchgeführt und diese in einer Datenbank in R geplottet und die Ergebnisse dann per ANOVA/Fisher getestet.

Bei „normalen“ Silben in dieser Sprache, die wirklich Töne tragen, - das war sozusagen meine Kontrollgruppe - bekomme ich ein sehr signifikantes Ergebnis von etwa P = 7·10-8. Töne sind in normalen Silben also deutlich so wie sie sein sollten (High, Mid, Low).
Bei einer bestimmten Art Silben sollen angeblich ebenfalls Töne vorkommen, was aber aus verschiedenen Gründen unwahrscheinlich ist. Ich habe das angezweifelt und getestet. Mein Annahme ist, dass es dort bei den mit H, M und L markierten Silben eben keine signifikanten Tonhöhenunterschiede gibt. Man sieht das auch sehr schön in den Daten (d.h. die gemessenen mittleren Tonhöhen sind immer ziemlich identisch).
Meine Nullhypothese war also, dass es einen Unterschied gibt, ähnlich wie bei den „normalen“ Silben. Per ANOVA/Fisher bekomme ich einen Signifikanzwert von ungefähr P = 0.8 für die Nullhypothese raus. Also ein sehr hoher Wert.

Daraus schließe ich jetzt: in den „normalen“ Silben ist die Unterscheidung/Entsprechung der 3 Töne höchst signifikant. Kein Wunder, es wäre ja sonst auch keine Tonsprache (wie Chinesisch oder Thai). In den „speziellen“ Silben ist die Unterscheidung/Ensprechung dieser 3 Töne aber extrem insignifikant.
Kann ich daraus den Schluss ziehen: Es gibt Tonunterscheidung in den „normalen“ Silben dieser Sprache, aber nicht in den „speziellen“ Silben? Oder wäre das ein Fehlschluss?

Eine Freundin sagte mir, man könne so etwas nicht aus einer Nullhypothese schlussfolgern, bzw. dass meine Nullhypothese falsch gewählt wäre, da man mit ANOVA eigentlich immer testet, ob es einen Unterschied gibt, nicht ob es keinen gibt.

Optisch ist eigentlich aus den Boxplots klar, dass diese speziellen Silben keine Töne tragen dürften. Man sieht das. Aber das reicht natürlich in der Wissenschaft nicht aus. Ich brauche also einen Signifikanztest.

Vielen Dank im Voraus!

  • André

Hallo,

Eine Freundin sagte mir, man könne so etwas nicht aus einer
Nullhypothese schlussfolgern, bzw. dass meine Nullhypothese
falsch gewählt wäre, da man mit ANOVA eigentlich immer testet,
ob es einen Unterschied gibt, nicht ob es keinen gibt.

ja, Deine Freundin hat Recht. Aus einer nicht abgelehnten Nullhypothese kann man strenggenommen und ohne weitere Information nicht schlußfolgern, daß die Nullhypothese zutrifft oder nicht. Eine Poweranalyse könnte hier für Klarheit sorgen.

Beste Grüße

Oliver

Danke für die Antwort!

ja, Deine Freundin hat Recht. Aus einer nicht abgelehnten
Nullhypothese kann man strenggenommen und ohne weitere
Information nicht schlußfolgern, daß die Nullhypothese
zutrifft oder nicht. Eine Poweranalyse könnte hier für
Klarheit sorgen.

Ich werde mal derweil nachschlagen, was das ist und ob ich das bei meinen Daten anwenden kann.

Eventuell könnte ich allerdings auch meine Annahme ändern: ich war darauf aus, zu beweisen, dass es auf diesen speziellen Silben keine Töne gibt. Ohne jetzt hier zu stark in die Linguistik reinzugehen… ich kann auch von der Nullhypothese ausgehen, dass es da keine Töne gibt, und dass die Alternativhypothese ist, dass es eben doch Töne dort gibt. Und dann kann ich anhand des Fisher-Tests zeigen, dass mit P = 0.8 eigentlich nichts darauf hindeutet, dass es dort Töne gibt.

Mit anderen Worten, statt zu versuchen, mathematisch zu beweisen, dass es da keine Töne gibt, kann ich zumindest mathematisch zeigen, dass die Annahme, dass da Töne sind, nicht statistisch signifikant ist.

Meine eigene Annahme ist zwar, dass es keine Töne gibt, aber für die Vorgehensweise sollte ich quasi vom Gegenteil ausgehen. Erscheint das logisch?

Viele Grüße aus Zürich!

  • André

Hallo,

Mit anderen Worten, statt zu versuchen, mathematisch zu
beweisen, dass es da keine Töne gibt, kann ich zumindest
mathematisch zeigen, dass die Annahme, dass da Töne sind,
nicht statistisch signifikant ist.

ich denke nicht, daß es etwas anderes ist, als Du bereits gemacht hast. Das Problem, daß man aus Nichtsignifikanz strenggenommen keine Schlußfolgerung ziehen kann, ohne eine Poweranalyse gemacht zu haben, bestünde weiterhin.

Mir ist nach dem Abschicken meiner Antwort heute nacht noch eingefallen, daß Dein statistisches Auswertungsdesign möglicherweise suboptimal ist. Mir schwebt eine Zusammenfassung Deiner Analysen vor, die einen statistischen Test beinhaltet, aus dessen Signifikanz man genau die Schlußfolgerungen ziehen könnte, die Du ziehen möchtest.

Viele Grüße aus Zürich!

Ja, Zürich ist eine schöne Stadt und hat einen tollen See.

Beste Grüße

Oliver