Hallo Zusammen,
im Zusammenhang mit meinem Praktikum muss ich einen Datensatz (ca. 100.000 Zeilen) auf eine höhere Aggregationsstufe bringen. Der Datensatz beinhaltet 9 Attribute welche jeweils für neue Zeilen sorgen und teilweise mit unterschiedlichen Aggregationslogiken (SUM, MIN, MAX, AVG) aggregiert werden müssen. Der Clou bei meinem Problem ist dabei, dass das Aggregationslevel variabel sein muss. D.h. es muss möglich sein mal nur über 2-3 Attribute zu aggregieren und einige Aggregationsschritte auszulassen. Idealerweise sollte das Tool so dynamisch wie möglich arbeiten, sodass regelmäßig neue Daten reingeladen werden können.
Ich habe damit begonnen einige Pivot-Tabellen für jeden Aggregationsschritt zu basteln, welche jeweils auf das vorherige (niedrigere) Aggregationsniveau zugreifen. Das Problem hierbei ist, dass durch die Aggregation ja nicht nur Zeilen sondern aus Spalten (also die Attribute über die aggregiert wird) verloren gehen. Gibt es eine Möglichkeit dies zu verhindern? Die Attribute solten weiterhin in der Pivot auftauche, aber nicht für zusätzlich Zeilen sorgen, da über sie aggregiert wurde.
Das zweite Herausforderung ist, den Aggregationsvorgang dynamisch zu halten, also einige Schritte zu überspringen. Gibt es z.b. ein if-statement um die Datenbasis für die Pivot zu ändern, wenn z.B. ein Indikator auf 1 steht o.Ä.? Oder fällt euch etwa eine ganz andere Lösung für das Problem ein. Vielen Dank im Vorraus!
Carsten