Hallo
Ich hab eine recht spezielle Statistik Frage zur Analyse von Sequenzier Daten:
Auf einem zufaelligen Genome Abschnitt weiss ich wo sequenzierte Reads anfangen. In einem transkribierten Abschnitt sollten sie Poisson verteilt sein. In einem nicht-transkribierten Abschnitt sollten sie (abgesehen von rauschen) null sein. Ich weiss aber nicht welche Abschnitte transkribiert und welche nicht transkribiert werden. So weit mal das Grundproblem.
Ich habe also read counts per position und möchte darauf ein zero-inflated Poisson Distribution anwenden. Genauer gesagt möchte ich λ berechnen welches den sozusagen „zero deflated“ anteil der distribution beschreibt (da sind natürlich immer noch manche nullen drinn, aber nur so viele wie durch die daten und λ einwandfrei zu erklären sind.
Ich mache das ganze in R:
wenn ich eine Verteilung mit λ=0.75 generiere und die noch um 10 Nullen inflate
X