Moin moin!
Erstmal sorry, dass ich das übersehen habe, irgendwie kam keine E-Mail-Benachrichtigung für diese Anfrage bei mir an
Liebe/-r Experte/-in,
Ich möchte per robot.txt verhindern das die Bilder diverser
Bildordner meiner Internetseite von den Suchmaschinenrobots
indexiert werden und bei den Google Suchergebnissen
auftauchen. Wie lauten die entsprechenden Befehle in der
robot.txt? Der Pfad zu den Bilder lautet:
Veranstaltungen/Party/Bilder
Das ist relativ einfach. Erstelle im Root-Verzeichnis einfach die robots.txt mit folgendem Inhalt:
User-agent: *
Disallow: /Veranstaltungen/Party/Bilder/
Mach dir aber bitte bewusst, dass das den Zugriff nicht blockiert, sondern der Suchmaschine lediglich mitteilt, dass es nicht gewünscht ist dieses Verzeichnis auszulesen. Darauf zugreifen kann die Suchmaschine trotzdem, wenn sie die robots.txt ignoriert. Google und die üblichen weiteren seriösen Suchmaschinen beachten allerdings die Angaben in der robots.txt und ignorieren die angegebenen Ordner entsprechend. Insofern braucht man sich keine großen Sorgen machen. Aber unseriöse Suchmaschinen könnten (Konjunktiv!) rein theoretisch trotzdem die Bilder indizieren.
Es wäre zwar möglich Suchmaschinen mit Hilfe von Webserver-Konfigurationen von bestimmten Ordnern auszuschließen, jedoch ist das a) sehr aufwändig und b) geben sich unseriöse Suchmaschinen nicht unbedingt als bot zu erkennen, weshalb die Richtlinien dann hinfällig sind. Grund hierfür ist, dass meist der User-Agent überprüft wird, den jeder bot selber definieren kann. Trägt man hier die Kennung ein, die auch ein FireFox-Browser sendet, sieht es für den Server nicht als Bot aus und er lässt den bot durch. Würde man auch dieses blocken, käme niemand mit einem FireFox mehr auf den Ordner. Entsprechend gilt: Man kann es bots zwar erschweren gegen die robots.txt zu ignorieren, aber gänzlich verhindern kann man garnichts. Was für einen normalen Surfer offen ist kann auch jeder bot abgrasen.
Muß die robot.txt ins Root Verzeichnis? Auf welcher Seite muß
ich die robot.txt (per metatags?) einbinden. Auf allen Seiten
oder nur auf der Index.html ?
Ja, muss sie. Suchmaschinen suchen normalerweise nur dort nach der robots.txt und sonst nirgends.
Eingebunden werden muss die Datei nirgendwo. Suchmaschinen-bots fragen die Datei einfach ab. Erhalten sie einen Fehler 404, weil die Datei nicht da ist, gibt es keine Einschränkungen, bekommen sie die Datei, wird diese in der Regel ausgewertet und beachtet.
Im Vorraus schon mal herzlichen Dank für Deine Mühe
GeBe
Ich hoffe, dass dir das weiterhelfen konnte.
LG
Lutz