Verteilung statistik, 'invertieren'

liebe wissende,
ich habe unten eine liste angefügt. diese beschreibt wievielmal der jeweilige wert in einem vektor vorkommt (erste zeile besagt wieviel mal die ‚1‘ vorkommt, zweite zeile wieviel mal die ‚2‘ usw) im gesamten kommen werte von 1 bis 25.
nun zur ersten frage: kann mir jemand sagen, wie diese daten am ehesten verteilt sind (von den ‚klassichen‘ verteilungen, ich habe da leider herzlich wenig ahnung.) zweitens:
ich benötige eine funktion haben von der menge [1 bis 25] auf sich selbst, welche die elemente aus dem ursprünglichen vektor so abbildet, dass am schluss die werte zwischen 1 und 25 etwa gleich häufig vorkommen. kann mir jemand sagen, wie das zu bewerkstelligen ist?
gruss niemand

     1158864
     1221403
     1062940
      768315
      475832
      260146
      128198
       56335
       22854
        8780
        3202
        1055
         348
         158
          74
          33
          16
          22
           6
           6
           2
           2
           0
           1
           0

Hallo,

bin kein Statistiker aber bei der ersten Frage würde ich mal in Richtung Exponential-Verteilung schauen. Normalerweise geht man aber eher so ran, dass man auf Grund des Experiments eine gewisse Verteilung vermutet und diese dann anhand der Daten bestätigt. Das Einzelergebnis schließt ja nicht aus, dass sich nicht doch um eine Gleichverteilung handelt und man quasi nur „komisch“ gewürfelt hat. Informationen zur Herkunft der Zahlen könnten eine vollständigere Betrachtung ermöglichen.

Die zweite Frage ist mir nicht ganz klar. Du meinst die Menge {1,2,3,…,25}?
Wenn Du willst das f:{1,2,…,25} -> {1,2,…,25} jede Zahl genau gleich oft (d.h. genau einmal) im Bild hat, dann handelt es sich bei f schlicht um eine Permutation / Vertauschung der Elemente. Davon gibt es 25! (Fakultät) Stück.

Willst Du aber eine Wahrscheinlichkeitsverteilung haben? Dann ordne einfach den Zahlen 1,…,25 jeweils die Wahrscheinlichkeit 1/25 zu.

Willst Du eine Funktion f haben von den natürlichen Zahlen auf die Menge {1,2,3,…,25}
welche so „aussieht“, als würdest Du zufällig eine Zahl auswählen, so suchst Du einen „Pseudozufallsgenerator“. Die einfachsten Funktionen sind hier sicher die linearen Kongruenz Generatoren. Dabei ist f von der Form f(n) = an +b (mod 25).
„mod 25“ heißt, dass Du den Rest bei Division durch 25 nimmst.
Beispiel a=8,b=3. Dann ist f(10) = a*10 +3 = 83 = 23 (mod 25).
Man muss bei der Wahl von a und b etwas aufpassen, damit man wirklich alle 25 Zahlen erhält. Hier kannst Du einfach mal rumprobieren oder die genauen Nebenbedingungen googlen.

Soll die Funktion noch „zufälliger aussehen“, dann kannst Du auch einfach einen Zufallsgenerator von Deinem Computer nehmen – z.B. aus Excel, der Dir i.A. Zahlen zwischen 0 und 1 liefert. Ist x so entstanden, dann ist z.B. floor(25*x+1) eine Zahl zwischen 1 und 25.

Beste Grüße
Zwergenbrot

Kleine Korrektur:

Der lineare Kongruenzgenerator funktioniert natürlich rekursiv, d.h. f(x_n) = a*x_{n-1} +b. Mit einem selbst gewählten Startwert.

Sorry,
Zwergenbrot

Hallo

Zusätzlich zum bereits Geschriebenen:

nun zur ersten frage: kann mir jemand sagen, wie diese daten
am ehesten verteilt sind

Neben der Exp-Verteilung (http://de.wikipedia.org/wiki/Exponentialverteilung) könnte auch die Benford-Verteilung passen: http://de.wikipedia.org/wiki/Benfordsches_Gesetz
Mittels eines statistischen Anpassungstests kann man versuchen, diese Hypothesen auf einem bestimmten Signifikanzniveau (nicht) zu verwerfen.

ich benötige eine funktion haben von der menge [1 bis 25] auf
sich selbst, welche die elemente aus dem ursprünglichen vektor
so abbildet, dass am schluss die werte zwischen 1 und 25 etwa
gleich häufig vorkommen.

Linearer Kongruenzgenerator: http://de.wikipedia.org/wiki/Kongruenzgenerator (unter Wahl der passenden Startwerte).Die Güte des Ergebnisses lässt sich wieder mittels eines Anpassungstests überprüfen.

mfg M.L.