Hallo!
Ich schreibe gerade an einem Programm (Sprache ist VB.NET; Framework 2.0), in dem nach Stichworten gesucht werden soll. Die Daten stammen aus OCR erkannten Bildern.
Die Stichwortdatei ist derzeit so aufgebaut, dass pro Zeile ein Wort steht und das Vorkommen (also z.B.: „bahnhof“,„1928/117“). Dadurch, dass viele Dokumente durchsuchbar sein sollen, sind in der Datei über 3 Millionen Einträge (bzw. Zeilen).
Jetzt bin ich auf der Suche nach einer Lösung, diesen Datenberg so schnell wie möglich durchsuchen zu können. Bei der Suchfunktion soll man auch Wörter ausschließen können bzw. bei mehreren angegebenen Ausdrücken diese als UND-Verknüpfung auswerten.
Habt ihr Ideen dazu?
mfg
chris