Wie funktioniert die Indexerstellung bei Google?

Hallöchen,
ich habe seit neustem Google Desktop installiert.
Ich bin ganz begeistert von dieser Funktionalität.
Nun habe ich mal im Internet nachgelesen, wie das so funktionieren soll, weil mich das rein vom Prinzip interessiert.

Bei Google Desktop steht im Internet, dass Google Desktop einen durchsuchbaren Index erstellt.
Was ist ein durchsuchbarer Index? Eine Datei?
Wie kann denn so ein durchsuchbarer Index aussehen?
Wie wird so ein Index erstellt?
Gibt es dafür Methoden, Rechenschemata?
Ich kann mir das gar nicht vorstellen.
Liegt dieser Index dann in einer Datenbank? Oder wo legt Google Desktop das ab?

Gruß
Sina

Bei Google Desktop steht im Internet, dass Google Desktop
einen durchsuchbaren Index erstellt.
Was ist ein durchsuchbarer Index? Eine Datei?
Wie kann denn so ein durchsuchbarer Index aussehen?

Hallo Sina,

im Prinzip ist es einfach: ein Indexdienst (es gibt auch andere als google) legt eine Wortliste an und vermerkt zu jedem Wort, in welchen Dateien es zu finden ist. Wenn du dann „Vertrag Meier“ suchst, braucht das Programm nur in der Liste unter Vertrag und unter Meier nachsehen, anstatt 10000 Dateien durchzulesen.

Die Kehrseite ist natürlich, dass die Software jede Datei durchlesen muss und die Wortliste entsprechend aktualisieren, aber eben nur einmal. Die Liste ist auch umfangreich, aber auch nicht soo gross, wie man vielleicht erwarten würde - wenn du deine Korrespondenz einmal statistisch auswertest, wirst du dich wundern, mit wie wenig Worten du auskommst (Schätzungen gehen von Adenauer 5000 bis Goethe 25000).

Gruss Reinhard