Moien
Als Programmier-Fortgeschrittener habe ich mich selber mal an
das Thema Mustererkennung herangewagt und ein kleines Programm
geschrieben, das ein Bild auf dem Desktop erkennen soll.
Ähm… du willst ein bekanntes Muster (das Bild) in einer grösseren Fläche (den Desktop) finden ? Und das Bild ist Pixel für Pixel exakt bekannt ? Da würde ich zu Quersummen greifen.
Wie arbeitet das Gehirn, um zum Beispiel ein Gesicht zu
erkennen? (bestimmt nicht Pixel für Pixel…)
Da gibt es einige schöne Arbeiten von den Honda Research Institutes (http://www.honda-ri.com/). Da forscht u.a. ein Dr. Heiko Wersing an neuronalen Ansätzen zur Objekterkennung. Man kann sich desen Veröffentlichungen von HP runterladen (falls die HP mal zufälligerweise funktioniern sollte. Ich weiss nicht an was die sonst noch forschen aber stabile und funktionierende Internetauftritte sollten sie nochmal proben).
Ganz grob läuft der Ansatz drauf hinaus die unterschiedlichen Hirnregionen nachzubauen. D.h. man fängt bei der Netzhaut an. Die Zellen melden nicht die Helligkeit die sie sehen, sondern den Unterschied der eigenen Helligkeit zu denen der Nachbarzellen (Kantenbild, Roberts Cross operator). Im nächsten Block sprechen die Zellen auf Kantenmuster (Kante mit Knick, Kreuzung von Kanten, Abzweigung…) an. Die letzte Schicht mappt die erkannten Mustern zu Objekten.
Das System wird immerwieder gerne bei Wettbewerben (wer erkennt die meisten Objekte aus den Standardvorlagen XY) eingesetzt, funktioniert aber auch mit realen Bildern ganz gut.
Und gibt es dafür irgendwelche erfolgreichen Ansätze in der
Gegenwart?
SIFT und SURF. Aber die 2 haben nicht viel mit Gehirn am Hut. Und die Lizenz von SIFT macht mir Sorgen.
Eine ganz andere Schlagrichtung hat das Projekt GIFT (früher Viper). Die erkennen keine Objekte sondern nur ähnliche Bilder. Deren Spiel ist viel einfacher nachzubauen, aber leider sinnfrei wenn man wirklich Objekte (und keine Bilder) erkennen möchte. Als Einsteiger in die lustige Welt der Bildverarbeitung aber ganz brauchbar. Google hat vor kurzen auch ein Paper zu dieser Gattung rausgebracht.
Ebenfalls einfach und schnell nachbaubar ist die Houghstransformation. Damit erkennt man einfache geometrische Formen (Linie, Kreis).
cu