Statistik mit r, beispiel normalverteilung,

Hallo!
Also ich habe eine Tabelle, die so aussieht
Klima bodentyp Collembolen Acari …
c t 15 17
d f 17 0
c s 0 7
d t 8 10
c f 0 40
d s 1 0
… … … …

und am Anfang hätte ich vorgehabt, dass ich mit einem Kolmogorov-Test die Normalverteilung teste, dann mit einem Levenge-Test die Varianz und dann mit einer zweifaktoriellen Varianzanalyse die Zusammenhänge zw Klima, Bodentyp und Anzahl der Insekten teste. Aja und alles mit dem Statistikprogramm r.
So, bei der Normalverteilung waren dann natürlich einige Daten nicht normalverteilt, meistens die Insektenordnungen in denen viele 0 enthalten sind. Mit einer Boxcox Transformation kann ich nicht arbeiten, da hier die Daten größer wie 0 sein müssen. Und jetzt weiß ich nicht mehr weiter.
Irgendwo habe ich gelesen, dass keine Normalverteilung notwendig ist, weil es sich um einen Zählprozess handelt, aber um eine zweifaktorielle Varianzanalyse zu machen ist ja die Normalverteilung Vorraussetzung.
Dann habe ich noch erfahren, dass es für R ein eigenes Paket für zero inflated data gibt. Hier weiß ich aber nicht, ob das jetzt für die Normalverteilung oder für die Transformation oder so ist?
Von einem anderen habe ich wieder gehört, dass transformieren gar nicht so wichtig ist?
Jetzt weiß ich nicht was ich machen soll. Also meine frage wie kann ich am einfachsten in r mit meinen Daten einen Zusammenhang/oder keinen Zusammenhang zw. Klima, Bodentyp und meinen einzelnen Insektenordnungen testen?
Also ich habe 2 verschiedene Klima, 3 verschiedenen Bodentypen, dabei jeweils 3 Wiederholungen, also insgesamt 18 Felder. diese 18 Felder habe ich an 3 verschiedenen Terminen auf die Insektenordnungen untersucht.
ich hoffe ihr könnt mir helfen.
lg

Liebe laus,
ich kann mich mit deinem Problem leider im Moment nicht beschäftigen, weil ich total eingespannt bin.
Ich schaue aber in ca. einem Monat noch mal rein und wenn dir bis dahin noch keiner helfen konnte, dann schaue ich mal, was ich machen kann…
Viele Grüße von
Schildkröte

Hi,

das Stichwort hast du selbst genannt: Zählprozess.
Bei dir würde sich eine Poisson-Regression anbieten, was eine subklasse der GLM ist (hier eine schnelleinführug: http://www.statmethods.net/advstats/glm.html).
Da du aber viele 0en hast, kommt noch ein weitere schon von dir genanntes Stichwort zum zuge: zero-inflated.
schau dir mal das hier an: http://www.ats.ucla.edu/stat/r/dae/zipoisson.htm

welches package du am Ende nimmst hängt auch davon ab, ob du noch andere Faktoren berücksichtigen willst: random effects, interactionen, overdispersion, exact estimation (due to small sample size),…

Gemeinsam habe die analysen, dass du die _untransformierten_ Daten reinsteckst. Die nötige TraFo machen die functions dann schon selber.

Grüße,
JPL

Danke für die schnelle Antwort! :smile:

Tut mir Leid, aber ich habe Dein Problem nicht wirklich verstanden (davon abgesehen, dass ich von R keine Ahnung habe). Aber wenn ich das richtig sehe, hast du ja einige Variablen, die nicht metrisch sind, so dass du mit einer Varianzanalyse nicht weiter kommst (egal ob der Rest normalverteilt ist). Daher solltest du dich mit Zusammenhangsmaßen für nicht metrische Variablen beschäftigen.

vielleicht hilft der link
http://www.r-statistics.com/2010/04/repeated-measure…
weiter. oder auch das paket repolr.

www.masta-support.de