Hallo,
Ich stehe vor dem Problem, dass ich Datensätze miteinander
vergleichen muss anhand verschiedener Kriterien. Dabei soll
fetgestellt werden, wie gut Datensätze dabei zueinander
passen.
Wenn es dir nur um Ähnlichkeit geht, musst du dir vermutlich selbst was ausdenken.
Im konkreten Fall geht es um Bars, die anhand diverser
Kriterien eingestuft werden (z.B. Publikum, Musik, Essen,
Gestränke, Preis). Wie gehe ich an dieses Problem am besten
ran?
Du probierst, den Werten in irgend einer Form Zahlen zuzuordnen, z.B.
Publikum: 40 (Durchschnittsalter), 8 (mittleres Einkommen auf einer Skala von 1 bis 10)
Preise: 4 (Mittlerer Preis für ein Liter Bier)
Wie auch immer. Wenn du dann zwei Bars vergleichen willst, bildest du von jeweils gleichen Daten den Betrag der Differenz, gewichtest es so wie dir es passt - das musst du einfach ausprobieren.
Kann mir einer hierzu den Namen eines Algorithmus, eine
gute Webseite oder ein Buch (das wäre genial!) nennen, wo
diese Probleme angegangen werden?
Ich glaube, da steckt weniger Wissenschaft dahinter als du denkst.
Es sei denn, willst z.B. automatisch Gruppen von ähnlichen Bars finden (das wären dann sogenannte „Cluster-Algorithmen“), oder noch andere Dinge mit deinem Ähnlichkeitsmaß anstellen.
Grüße,
Moritz