Statistik: T-Tabelle für große n

Hallo,

ich nutze diese T-Tabelle im rahmen eines T-Tests

http://eswf.uni-koeln.de/glossar/tvert.htm

Wie verfahre ich dabei wenn ich sehr viele Messwerte habe, also n >> 1000

Darf ich diese Tabelle einfach extrapolieren?

Wenn ja, kann ich in der Fortsetzung ein (Quasi)lineares Verhalten der Kurve ansetzen (Kurve im Sinne von Spalte „0,95“ über n aufgezeichnet)? Ich bin mir im klaren darüber dass ich dann für n --> unendlich null unterschreiten würde, allerdings arbeite ich im Maximum etwa mit 50K Messwerten, wo ich bei linearer extrapolation etwa bei einem T-Wert 1,668 am unteren Ende der „0,95“ Spalte landen würde. Für mich wäre dieser Wert gut, allerdings weiß ich nicht ob das Mathematisch halbwegs astrein ist.

Ich freue mich auf eure Antworten!
Vielen Dank!

MfG,
Sen

Hallo,

hierzu etwas Statistische Theorie!

Frage dich mal, warum du überhaupt die t-Verteilung nimmst? Ich vermute du machst es, weil es alle so machen, oder dein Prof es dir gesagt hat, oder?! :wink:

ALSO:

Wie funktioniert ein t-test? Der Ausgangspunkt ist eine Zufallsvariable, die normalverteilt ist.

x\sim N\left(\mu,\sigma^2\right)

Nun willst du die Hypothese überprüfen, dass der „wahre“ Wert für x eine bestimmte Zahl ist, sagen wir 5.

Nun hast du das Problem, dass du weder \mu noch \sigma^2 kennst. Was machst du also?!

Du subtrahierst einfach von deinen Beobachtungen 5, dann hat deine Variable unter der Nullhypothese schon mal den Erwartungswert von 0.

x-5\sim N\left(0,\sigma^2\right)

Nun kannst du noch durch \sigma dividieren, dann erhälst du eine standard-normalverteilte Variable.

\frac{x-5}{\sigma}\sim N\left(0,1\right)

Bis hier ist alles schön, du hast nur ein \bf{Problem} :

Du kennst \sigma nicht. Also musst du \sigma aus den Daten schätzen.

Wenn du \sigma aber schätzt, ist es nur eine Realisation einer Zufallsstichprobe, die wiederrum \chi^2 verteilt ist.

Wenn man das nun rechnet, wobei ich auf die details verzichte, kommst du zu dieser Gleichung:

\frac{\sqrt{n}\cdot(x-5)}{\widehat{\sigma}}\sim t_{n}

Da \widehat{\sigma} ein srwatungstreuer Schätzer ist, gilt:

\lim_{n \to \infty}\widehat{\sigma}=\sigma

Daher bist du dir, bei unendlich vielen Beobachtungen über die Varianz sicher und du kannst die Normalverteilung nehmen.

Ist ja auch logisch, die t-Verteilung brauchst du ja nur, weil du die „wahre“ Varianz nicht kennst.

Verstanden?!

Hallo Helferlein und danke für die ausführliche Regelkunde,

den T-Test nehme ich in meinem Jugendlichen Leichtsinn daher weil er uns als adequates Mittel erschien, meinen vorliegenden Sachverhalt zu untersuchen. Dabei Schwankt die Anzahl der Messwerte stark. (Auch mal nur 400, oder eben 50000)
Ja, was du schreibst habe ich verstanden und hatte ich auch davor schon ein mal in abgewandelter Form überflogen. Großes Danke dennoch, denn deine Ausdrucksweise ist sehr Verständlich für einen Laien wie mich.

Kann ich also aus der limitierung der Tabelle bis n=1000 darauf schließen, dass derjenige der die gebastelt hat n=1000 als die Schwelle festgesetzt hat nach derer Überschreitung man die normalverteilung ansetzen kann/sollte?

Sollte man das dann wirklich (aus korrektheitsgründen) oder ist es ab der Stelle dann einfach mit Kanonen auf Spatzen schießen, den Test weiterhin anzuwenden? (Wobei man ja auch mit Kanonen Spatzen schießen kann :wink: )

Ich schäme mich fast wie Statistik banausig ich dir daher kommen muss, aber die Funktion ist bereits in mein Projekt implementiert und ich suche, wie du gerade liest, nach jedem Strohhalm daran festhalten zu können :smile: Ich muss auch ganz klar sagen, dass das nur eine randigste Randfunktion darstellt… die aber natürlich auch (halbwegs :stuck_out_tongue:) wissenschaftlich korrekt daher kommen sollte.

Roman Ende und danke nochmals.

MfG,
Sen

Ich freue mich immer über sternchen… :smile: