Normalverteilung über Durchschnitt - xls

Hallo,

leider sind meine Statistikkenntnisse sehr eingerostet und nach langer Suche versuche ich auf diesem Weg eine Antwort zu finden - ich hoffe es kann mir jemand behilflich sein.

Da die Original-Daten gross und sperrig sind versuche ich es mit diesem Beispiel - es liegen mir folgende Werte vor:
Durchschnittswert/Datei : 2 mb
min. Wert/Datei: 1 mb
max. Wert/Datei: 3 mb
Gesamtanzahl Dateien: 100 Stück

Nun meine Frage:
Wie kann ich in Excel die Normalverteilung darstellen, so dass in der Kurve Grösse / Anzahl in einer Gausschen Glockenkurve ersichtlich ist?

Vielleicht hat jemand auch eine Lösung parat, in der ich eine Gesamtanzahl > 1 Mio Dateien bearbeiten kann.

Hoffentlich findet sich hier jemand, für den die Lösung des Problems sehr einfach ist.

Vielen Dank im Voraus für Antworten.

Es grüsst
Skilja

hi,

da ist noch manches unklar, finde ich.

Da die Original-Daten gross und sperrig sind versuche ich es
mit diesem Beispiel - es liegen mir folgende Werte vor:
Durchschnittswert/Datei : 2 mb
min. Wert/Datei: 1 mb
max. Wert/Datei: 3 mb
Gesamtanzahl Dateien: 100 Stück

du willst also darstellen, dass dateigrößen an einem computer normalverteilt sind; versteh ich das richtig?

das ist natürlich streng genommen falsch, denn eine normalverteilung bezieht sich ja theoretisch auf werte zwischen - \infty und + \infty. aber näherungsweise könnte das stimmen.
es kann natürlich auch sein, dass die dateigrößen bimodal (oder „multimodal“) verteilt sind. gewöhnliche gebrauchstexte liegen um die 30 kB, komprimierte fotos um die 100-200 kB, soundfiles um die 3000-6000 kB, filme noch deutlich darüber. je nachdem, was sich im betreffenden betriebssystem abspielt, kommt da nicht unbedingt eine normalverteilung heraus.

Nun meine Frage:
Wie kann ich in Excel die Normalverteilung darstellen, so dass
in der Kurve Grösse / Anzahl in einer Gausschen Glockenkurve
ersichtlich ist?

größe oder anzahl? und von was?
wenn du deine fragestellung klarlegst, kann dir hier geholfen werden. evtl. kannst du dir dann schon selber helfen.

eine normalverteilung wird übrigens nicht vom minimalwert und vom maximalwert bestimmt (die es streng genommen nicht gibt, gar nicht geben kann), sondern vom mittelwert und der varianz bzw. der standardabweichung.

m.

hallo michael,
besten dank für deine schnelle antwort.

die verteilung die ich darstellen möchte ist von einem datenproduzenten, der files in den grössen 1 mb bis 3 mb liefert, die durchschnittsgrösse ist 2 mb. ich gehe davon aus, dass die grösste anzahl files 2 mb gross ist, und jeweils kleinere mengen der 1-1.9mb grossen files und kleinere mengen der 2.1-3mb grossen files.

es kann natürlich auch sein, dass die dateigrößen bimodal
(oder „multimodal“) verteilt sind. gewöhnliche gebrauchstexte
liegen um die 30 kB, komprimierte fotos um die 100-200 kB,
soundfiles um die 3000-6000 kB, filme noch deutlich darüber.
je nachdem, was sich im betreffenden betriebssystem abspielt,
kommt da nicht unbedingt eine normalverteilung heraus.

-> die pc-sicht kann aussen vor gelassen werden, wie gesagt, es handelt sich um einen datenproduzenten, leider kann keine aussage darüber getroffen werden, wieviel % kleine files & wieviel % grosse files vorhanden sind - ich habe nur den durchschnittswert und das gesamtdatenvolumen - und auf dieser basis muss ich die verteilung darstellen können (davon ausgehend, dass es gleich wenig kleine & grosse files gibt, und die grösste menge der files den 2 mb gross ist)

Nun meine Frage:
Wie kann ich in Excel die Normalverteilung darstellen, so dass
in der Kurve Grösse / Anzahl in einer Gausschen Glockenkurve
ersichtlich ist?

größe oder anzahl? und von was?

die darstellung soll sein:
y-achse: anzahl files
x-achse: filegrösse
kurve: verteilung
(ich hatte das bereits versucht - bin aber gescheitert…) aber vielleicht ist dann die normalverteilung auch nicht das korrekte werkzeug dafür?
mir ist auch klar, dass ich nicht alle für die normalverteilung gültigen variablen habe - ich suche nach einer möglichkeit, das ganze wie eine solche darzustellen.

hoffentlich habe ich mich nun etwas verständlicher ausgedrückt und hoffe, dass es nun leichter ist auf meine frage zu antworten.

vielen dank im voraus.

viele grüsse
skilja

hi,

y-achse: anzahl files
x-achse: filegrösse
kurve: verteilung

was hindert dich, in irgendeiner tabellenkalkulation …

  1. in spalte A die dateigrößen in klassen zu notieren (also z.b.: 1000-1099 kb, 1100-1199 kb, 1200-1299 kb, …)
  2. in spalte B die jeweilige anzahl der zu dieser klasse gehörenden files

und dann …
3. die spalten A und B gemeinsam als balkendiagramm (oder von mir aus sogar als liniendiagramm) darzustellen
???

ich seh das hindernis nicht.

beziehungsweise:

  • du lässt dir eine liste geben / machen der dateien mit ihren dateigrößen
  • lädst diese liste in irgendeine tabellenkalkulation
  • und gehst dann zum verfahren wie oben beschrieben, indem du dir einfach zählen lässt, wie oft verschiedene dateigrößen vorkommen (funktion ZÄHLENWENN bzw. COUNTIF)
  • und lässt dann dieses ergebnis zeichnen

???
m.

hallo,
besten dank für die schnelle antwort.
genau das ist das problem: ich habe die anzahl der vorkommenden files pro klasse nicht. eine abfrage dieser daten ist nicht möglich, das wurde schon versucht. und aus diesem grund die frage hier im forum: ich muss auf eine theoretische verteilung zurückgreifen. und die möchte ich generierene, in den mir vorgegebenen grenzen.
die frage ist nur: wie?
viele grüsse
skilja

hi,

genau das ist das problem: ich habe die anzahl der
vorkommenden files pro klasse nicht. eine abfrage dieser daten
ist nicht möglich, das wurde schon versucht.

jetzt versteh ich gar nix mehr. du hast keine realen daten? ja was willst du denn darstellen?

übrigens interessantes passiv: „das wurde schon versucht“. von wem? auf welcher basis? mit welchem material und welchen instrumenten?

und aus diesem
grund die frage hier im forum: ich muss auf eine theoretische
verteilung zurückgreifen. und die möchte ich generierene, in
den mir vorgegebenen grenzen.

du findest im web tausende bilder theoretischer normalverteilungen. die geben alle dieselben grundsätzlichen verhältnisse wieder.

die frage ist nur: wie?

du kannst auch in irgendeiner tabellenkalkulation ein bild (d)einer normalverteilung herstellen.

probier mal folgendes:

  1. libreOffice (openOffice) öffnen (ja; geht vermutlich auch ganz ähnlich mit excel)
  2. in zelle A1 die zahl 800 eintragen
  3. in zelle A2 die formel „=A1+100“ eintragen
  4. in zelle D1 die zahl 2000 eintragen
  5. in zelle D2 die zahl 300 eintragen
  6. in zelle B1 die formel „=NORMVERT(A1;D$1;D$2;0)“ eintragen
  7. zelle B1 markieren und am quadrat rechts unten in die zelle B2 weiterziehen (ausfüllen)
  8. zellen A2 und B2 gemeinsam markieren und wie in schritt 7. ausreichend weit (ca. 30 zeilen) nach unten ziehen

du müsstest dann die daten einer normalverteilung mit mittelwert 2000, standardabweichung 300 ab dem x-wert 800 haben. in den zellen D1 und D2 kannst du übrigens mittelwert und standardabweichung einstellen.

wenn du dann …
9. die spalten A und B markierst und
10. das als x-y-diagramm zeichnen lässt,
hast du das bild einer normalverteilung mit mittelwert 2000 und werten ziemlich genau zwischen 1000 und 3000.

isses das, was du willst?

wenn ja: das beweist natürlich für die von dir dargestellten daten (die du ja nicht hast) nichts außer deiner annahme, dass sie sich so verhalten.

???

m.