Datenanalyse-Modelle zwecks Vorhersage

Hi allerseits! :smile:

Ich habe eine vorhandene Datenbank mit ca. 12000 Ereignissen. Jedes Ereignis hat verschiedene Eigenschaften, welche ich analysieren möchte und aufgrund dieser Datenbasis zukünftige Ereignisse vorherzusagen.

Soweit so gut. Einfache Vergleiche einzelner Parameter ergibt mir brauchbare Vorhersageresultate mit ca. 50% Trefferquote (Wo es 3 verschiedene Möglichkeiten zur Vorhersage gibt), ich denke aber, dass da mehr drin sein müsste, wenn man es nur schafft, die Daten besser zu analysieren.

Gibt es für sowas bestehende Datenanalyse-Modelle in die ich mich einlesen könnte?

Beste Grüße und herzlichen Dank,
MV

Hallo,

wie haben Sie denn die Analysen bisher gemacht? Ein Modell nutzt doch nur etwas, wenn die Fragestellung klar ist. Sie können beispielsweise umfangreiche Auswertungen mit den PivotTables machen. Denn die Daten sind nur im Kontext mit den Firmenprozessen wirklich interpretierbar. Wenn Sie konkrete Fragestellungen haben, insbesondere beim Eisnatz von Excel, stehe ich gern als Gesprächspartner oder Berater zur Verfügung

Beste Grüße
H. Schuster

Hallo,

die Datenanalyse kann zunächst einmal nur ein Modell der bereits vorhandenen Daten liefern. Nur wenn das Modell darüber hinaus zufälligerweise auch noch die tatsächlichen Zusammenhänge zwischen den Daten richtig wiedergibt, kann man daraus Vorhersagen ableiten.
Um die Qualität der Modelle zu testen, generiert man das Modell nicht mit allen Daten, sondern behält einen repräsentativen Satz Daten zurück, um damit das gelernte Modell zu testen.

Du mußt zunächst schauen, ob Du nur quantitative, nur qualitative oder quantitative und qualitative Eingangsdaten hast. Dann mußt Du schauen, ob Du quantitative oder qualitative Antworten haben willst. Danach entscheidet sich die Vorauswahl der Datenanalyse-Verfahren.

Schau Dir bei Wikipedia den Artikel Data-Mining an. Im Abschnitt „Softwarepakete für Data-Mining“ findest Du auch kostenlose Software. Vielleicht kannst Du die verwenden und entscheiden, welche Verfahren für Deine Zweck am besten geeignet sein könnten.

Du solltest immer mehrere Verfahren verwenden, also mehrere Modelle erzeugen. Jedes Verfahren/Modell betrachtet nur einige wenige ganz bestimmte Aspekte.