Hallo Experten,
ich habe eine Trainingsmenge, bestehend aus etwa 10 Beispielen (zu je 30 Dimensionen). Die Beispiele sind übrigens Aufnahmen von (ungefähr gleichen) Benutzerbewegungen und sollen binär klassifiziert werden nach „ist Bewegung X“ bzw. „ist nicht Bewegung X“.
Das Problem ist, das sind alles positive Trainingsbeispiele; ich weiss also, wie gute Beispiele aussehen, kann sie aber nicht von Gegenbeispielen abgrenzen. Darum weiss ich auch nicht, wie ich die herkömmlichen Techniken wie Neuronale Netze oder Support Vector Machines einsetzen könnte, die Abgrenzungen suchen.
Jetzt könnte ich natürlich negative Beispiele erschaffen, indem ich einfach ein Dutzend „falsche Bewegungen“ ausführe. Nur, das garantiert mir keine wirkliche gute Trennung von meinen Positivbeispielen, die ich nicht im voraus kenne (die meinen „unsinnigen“ Bewegungen also zu sehr ähneln könnten).
Oder ich könnte einfach den 30-dim-Eingaberaum mit kalkulierten Negativbeispielen füllen (also Beispiele, die offensichtlich „ausserhalb“ meiner Trainingsmenge liegen), was zu einer Art Hülle um die Trainingsmenge führen sollte. Allerdings bräuchte ich ziemlich viele solcher kalkulierter Negativbeispiele.
Eine weitere Idee war, die Trainingsmenge einfach direkt durch ihre konvexe Hülle abzugrenzen. Das fällt (mMn) dann aber nicht mehr unter Machine Learning, was aber eigentlich das Ziel war…
Hat jemand eine Idee, wie ich da ansetzen soll? Ich bin für alle Anregungen dankbar, ich sitz da schon ewig dran und finde nichts Gutes…
Mit freundlichen Grüssen,
kvida